scrapy为起始请求的url添加headers

最新推荐文章于 2024-06-12 20:06:51 发布

blerli

最新推荐文章于 2024-06-12 20:06:51 发布

阅读量1.8k

点赞数 1

文章标签： scrapy

本文链接：https://blog.csdn.net/weixin_38859557/article/details/86223819

版权

scrapy 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

首先最简单的方法就是通过重写spider中的start_requests方法：

def start_requests(self):
    for url in self.start_urls:
        yield scrapy.Request(url, headers={'accept-language': 'zh-CN,zh;q=0.9,ja;q=0.8,',
                                           'cache-control': 'max-age=0,',
                                           # 'upgrade-insecure-requests': '1',
                                           # 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'
                                           })

还有一种更加直接的方法就是通过中间件的形式，

由于scrapy的架构问题，所有的请求url都会通过downloader来进行下载，那么在downloader之间加上一个中间件，在请求的时候就可以保证添加上了headers；具体看：https://mp.csdn.net/postedit/86219663

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

blerli

关注关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
scrapy为起始请求的url添加headers

首先最简单的方法就是通过重写spider中的start_requests方法：def start_requests(self): for url in self.start_urls: yield scrapy.Request(url, headers={'accept-language': 'zh-CN,zh;q=0.9,ja;q=0.8,', ...
复制链接

扫一扫