在scrapy爬虫的过程中出现 HTTP status code is not handled or not allowed 的问题导致爬虫无法继续,如下截图:
解决方式:
- 在settings.py文件中添加:
HTTPERROR_ALLOWED_CODES = [302]
- 截图中报错302,就在括号里添加302。若报错403就添加403。
附加说明:
- scrapy框架中有许多默认设置
- 可参阅:scrapy的settings设置(一)
相关笔记:
在scrapy爬虫的过程中出现 HTTP status code is not handled or not allowed 的问题导致爬虫无法继续,如下截图:
解决方式:
HTTPERROR_ALLOWED_CODES = [302]
附加说明:
相关笔记: