scrapy 在Request中设置flag,针对性处理对应的request

在构造Request时,增加flags这个参数,该参数会被转换为列表类型,查看源码的转换

self.flags = [] if flags is None else list(flags)
yield scrapy.Request(
                    url=url,
                    meta={'id': id},
                    dont_filter=True,
                    flags=[1],
                    callback=self.parse_isdel,
                )

在request中埋入flag,在经过中间件时,可以以此为判断依据,针对性处理每条Request

比如在下载中间件给对应的request设置代理,因为有些网站会对某一层的页面进行IP访问限制。

    def process_request(self, request, spider):
        if request.flags:
            if request.flags[1] == 1:
                request.meta['proxy'] = 'http://123.52.41.165:808'

你可能会报出以下错误

2018-09-20 14:07:54 [scrapy.core.engine] ERROR: Error while obtaining sta
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值