scrapy的errback

在Scrapy框架中,可通过设置DOWNLOAD_TIMEOUT参数来限制请求下载的最大时间,例如设置为10秒。当发生下载超时时,系统会记录错误并可能进行重试。在DEBUG日志级别下,可以观察到重试过程。为了处理这些错误,可以使用errback函数,它能在连接建立超时或DNS错误等情况下捕获并处理异常。官方示例展示了如何在Request对象中结合使用callback和errback功能。
摘要由CSDN通过智能技术生成

在scrapy我们可以设置一些参数,如DOWNLOAD_TIMEOUT,一般我会设置为10,意思是请求下载时间最大是10秒,文档介绍

如果下载超时会抛出一个错误,比如说

    def start_requests(self):
        yield scrapy.Request('https://www.baidu.com/', meta={ 'download_timeout': 0.1})

日志设为DEBUG级别,重试设为3次,运行之后的日志

2019-05-23 19:38:01 [scrapy.downloadermiddlewares.retry] DEBUG: Retrying <GET https://www.baidu.com/> (failed 1 times): User timeout caused connection failure: Getting https://www.baidu.com/ took longer than 0.1 seconds..
2019-05-23 19:38:01 [scrapy.downloadermiddlewares.retry] DEBUG: Retrying <GET https://www.baidu.com/> (failed 2 times): User t
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值