scrapy爬虫-代理设置

最新推荐文章于 2020-10-11 22:41:26 发布

云海丶一刀

最新推荐文章于 2020-10-11 22:41:26 发布

阅读量432

点赞数

分类专栏： scrapy 爬虫文章标签： scrapy 爬虫

本文链接：https://blog.csdn.net/gongli9662/article/details/88944091

版权

scrapy 爬虫专栏收录该内容

1 篇文章 0 订阅

订阅专栏

scrapy爬虫-代理设置

1.请求头User-Agent代理设置**

1.1 找到middlewares.py
在这里插入图片描述
1.2 找到一个绑定的DownloaderMiddlewar（生成scrapy爬虫目录的时候会默认生成一个Middlewar）
找到 process_request 方法，没有的话就自己添加一个
下载中间件
1.3 添加请求头代理，下面的代理就是添加请求头
usert_agent = “Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36”
request.headers[“User-Agent”] = usert_agent
在这里插入图片描述
#===================以上是usert_agent 请求头代理设置完成

2.设置ip代理请求头

2.1 在上面的 process_request 方法里面添加
request.meta[‘proxy’] = “http://xx.xx.xx.xx:3128”
xx.xx.xx.xx是ip ，aaa 是代理服务器的端口，
哪里有代理ip呢，你可以去西刺代理（https://www.xicidaili.com/nn/ ）网站去找，这个是免费的的，不稳定，存活时间比较短，如果你想要稳定的代理，那就需要你自己花钱去买
设置代理ip
这是我的微信，有不懂的可以加我微信
在这里插入图片描述

云海丶一刀

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
scrapy爬虫-代理设置

scrapy爬虫-代理设置1.请求头设置! 1.找到middlewares.py 这个文件(https://img-blog.csdnimg.cn/20190401111738201.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2dvb...
复制链接

扫一扫

专栏目录