先上菜,关闭Scrapy 自带的ROBOTSTXT_OBEY功能,在setting找到这个变量,设置为False即可完美解决.
# Obey robots.txt rules
ROBOTSTXT_OBEY = False
情景:
在爬取苏宁图书时,获取翻页数据调用无反应,于是打开日志文件发现此现象:
2019-06-08 16:44:43 [scrapy.core.engine]
先上菜,关闭Scrapy 自带的ROBOTSTXT_OBEY功能,在setting找到这个变量,设置为False即可完美解决.
# Obey robots.txt rules
ROBOTSTXT_OBEY = False
情景:
在爬取苏宁图书时,获取翻页数据调用无反应,于是打开日志文件发现此现象:
2019-06-08 16:44:43 [scrapy.core.engine]