Python Scrapy 302 重定向导致Closing spider (finished),想要继续运行(已解决)

该博客主要讨论了在使用Scrapy爬虫时遇到的302重定向问题,错误日志显示爬虫被重定向到防爬虫页面。为了解决这个问题,博主提出了在每个Request请求中添加`dont_filter=True`参数的方法,以确保爬虫能够继续执行并避免过滤重复请求。这有助于爬虫继续抓取目标网页,防止因重定向导致的爬取中断。
摘要由CSDN通过智能技术生成

错误描述如下

2021-08-06 11:08:25 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (302) to <GET https://tv.sohu.com/upload/static/special/anti-reptile/index.html> from <GET https://so.tv.sohu.com/list_p1101_p2_p3_p4_p5_p6_p7_p8_p9_p102_p11_p12_p13_p14.html>
2021-08-06 11:08:25 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (302) to <GET https://tv.sohu.com/upload/static/special/anti-reptile/index.html> from <GET https://so.tv.sohu.com/list_p1100_p2_p3_p4_p5_p6_p7_p8_p9_p102_p11_p12_p13_p14.html>
2021-08-06 11:08:25 [scrapy.core.engine] INFO: Closing spider (finished)

想要继续运行下去
解决如下:
在每次Request请求里添加 dont_filter=True

yield scrapy.Request(url=url
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值