scrapy-redis显示 Filtered offsite request to 错误

最新推荐文章于 2023-08-28 17:35:35 发布

执笔写回憶

最新推荐文章于 2023-08-28 17:35:35 发布

阅读量425

点赞数

本文链接：https://blog.csdn.net/z564359805/article/details/80803827

版权

如果使用以下方式，则会报错

    # 动态获取爬取域的范围
    # def __init__(self, *args, **kwargs):
    #     domain = kwargs.pop('domain', '')
    #     self.allowed_domains = filter(None, domain.split(','))
    #     super(MySpider, self).__init__(*args, **kwargs)

这样写就不会报错：

    # 指定爬取域范围
    allowed_domains = ['XXXX.com.cn']

其他说法：

官方对这个的解释，是你要request的地址和allow_domain里面的冲突，从而被过滤掉。可以停用过滤功能。

yield Request(url, callback=self.parse_item, dont_filter=True)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

执笔写回憶

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
scrapy-redis显示 Filtered offsite request to 错误

如果使用以下方式，则会报错 # 动态获取爬取域的范围 # def __init__(self, *args, **kwargs): # domain = kwargs.pop('domain', '') # self.allowed_domains = filter(None, domain.split(',')) # super(S...
复制链接

扫一扫