scrapy添加讯代理 动态转发(Python3)

1. 先行条件

将scrapy源代码,相对路径为:Lib/site-packages/scrapy/core/downloader/handlers/http11.py的文件中,

if isinstance(agent, self._TunnelingAgent):
   headers.removeHeader(b'Proxy-Authorization')

给注释掉。

必须将此注释掉,否则proxy-authorization会被去除,动态转发失效。

2. 示例middleware

class EpDownloaderMiddleware(object):
    def __init__(self):
        self.orderno = "XXXXXXXXXXXXXXXXXXXXXXX"
        self.secret = "XXXXXXXXXXXXXXXXXXXXXXX"

    def process_request(self, request, spider):
        request.meta['proxy'] = 'http://forward.xdaili.cn:80'
        timestamp = str(int(time.time()))  # timestamp
        string = "orderno=" + self.orderno + "," + "secret=" + self.secret + "," + "timestamp=" + timestamp
        md5_string = hashlib.md5(string.encode('utf-8')).hexdigest()  # sign
        sign = md5_string.upper()  
        auth = "sign=" + sign + "&" + "orderno=" + self.orderno + "&" + "timestamp=" + timestamp
        request.headers["Proxy-Authorization"] = auth

转载于:https://my.oschina.net/chenmoxuan/blog/3095926

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值