[判断题]通常，我们使用待爬取网站的域名作为爬虫名称。

A.正确
B.错误

更多"[判断题]通常，我们使用待爬取网站的域名作为爬虫名称。"的相关试题:

[判断题]如果规定了爬虫搜索的域名范围，那么该爬虫只能爬取此域名下的网页，其它URL会被忽略。

A.正确
B.错误

查看答案

[判断题]爬虫一定能够爬取任何域名范围内的数据。

A.正确
B.错误

查看答案

[判断题]CrawlSpider爬虫能够自动爬取任何网站上的数据。

A.正确
B.错误

查看答案

[判断题]爬虫软件是一种收集大量信息时常用的软件,而利用漏洞爬取信息则被称为是恶意爬虫。
A.正确
B.错误

查看答案

[判断题]网络爬虫能够爬取互联网上的任何数据。

A.正确
B.错误

查看答案

[填空题]CrawlSpider类使用( )属性来决定爬虫的爬取规则。

查看答案

[判断题]CrawlSpider类使用start_url属性来决定爬虫的爬取规则。

A.正确
B.错误

查看答案

[多选题]关于爬虫的爬取循环，下列说法正确的是(　　)。
A.当Request下载完毕后返回Response，并将其作为参数传给回调函数
B.在回调函数中分析网页数据，返回Item对象或者Request
C.在回调函数内，可以使用选择器或者任何解析器来分析网页生成item数据
D.最后返回的item将被存到数据库或文件中。

查看答案

[单选题]下列几个类中，用于表示CrawlSpider爬虫的爬取规则的是（）。
A.CrawlSpider
B.Spider
C.Rule
D.LinkExtractor

查看答案

[判断题]Scrapy程序启动后，引擎会先向爬虫请求第一个要爬取的URL。

A.正确
B.错误

查看答案

[填空题]Scrapy框架专门提供了一个( )爬虫类，能够自动爬取具有一定规则的网站上的所有网页数据。

查看答案

[单选题]Scrapy爬虫第一次下载数据时，会从（）中取出URL开始爬取。
A.name
B.parse
C.start_urls
D.allow_domains。

查看答案

[填空题]Scrapy shell是一个交互式终端，可用于在不启动爬虫的情况下( )爬取代码。

查看答案

[单选题]通过爬虫的方式常爬取的数据源主要是来自_______和app的数据( )
A.系统内数据；
B.传感器
C.网页
D.智能硬件