关于Scrapy请求报错捕获异常的解决方法

最新推荐文章于 2024-04-08 14:19:56 发布

没有竹蜻蜓的小叮当

最新推荐文章于 2024-04-08 14:19:56 发布

阅读量3k

点赞数 3

分类专栏： python 爬虫文章标签： python 中间件

本文链接：https://blog.csdn.net/qq_37144341/article/details/103852225

版权

python 同时被 2 个专栏收录

53 篇文章 3 订阅

订阅专栏

爬虫

19 篇文章 0 订阅

订阅专栏

Scrapy请求报错捕获异常解决

对于设置了代理的爬取，可能会出现TimeoutError, TCPTimedOutError, ConnectionRefusedError, ResponseNeverReceived, TunnelError等错误。
对此我的解决方式是在下载中间件中设置捕获异常来解决。
打开Middleware文件，找到下载中间件，在process_exception中自定义自己的异常解决方式。
先导入异常模块：

from twisted.internet.error import TimeoutError, TCPTimedOutError, ConnectionRefusedError
from twisted.web._newclient import ResponseNeverReceived
from scrapy.core.downloader.handlers.http11 import TunnelError

class WeiboSpiderMiddleware(object):
	def process_exception(self, request, exception, spider):
		if isinstance(exception, (TimeoutError, TCPTimedOutError, ConnectionRefusedError, ResponseNeverReceived, TunnelError)): 	#判断为那种异常类型
			pass	#自定义异常处理方式
			return requet	#重新请求

如有解决问题不妨点点关注，博主不定期更新Python爬过的坑

没有竹蜻蜓的小叮当

关注

3
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
关于Scrapy请求报错捕获异常的解决方法

Scrapy请求报错捕获异常解决对于设置了代理的爬取，可能会出现TimeoutError, TCPTimedOutError, ConnectionRefusedError, ResponseNeverReceived, TunnelError等错误。对此我的解决方式是在下载中间件中设置捕获异常来解决。打开Middleware文件，找到下载中间件，在process_exception中自定义...
复制链接

扫一扫