使用爬虫代理时遇到的一些问题

最新推荐文章于 2020-12-09 00:04:01 发布

Nanaras

最新推荐文章于 2020-12-09 00:04:01 发布

阅读量211

点赞数

分类专栏：个人笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Nanaras/article/details/99482675

版权

个人笔记专栏收录该内容

11 篇文章 0 订阅

订阅专栏

最近各个网站的反爬措施是越来越好了…爬虫也不是那么好做了，原来一直想不使用代理的我也不得不屈服…毕竟一分钟40个页面的频率还要冒着被封ip的风险还是很难受的…

Scrapy无法使用代理的问题

看了网上很多的的推荐我决定使用讯代理的动态转发服务，十万次转发20块，本着试一试的原则我还是咬咬牙（并没有）买了。按照官方的说明在scrapy里边配置好了（不得不说官方的示例代码是真的烂…），直接开始爬取测试，结果怎么爬都爬不出item来了？？？怎么回事？代理出错了？
在讯代理的控制台看了看转发数量的确没有减少，看来是真的出了问题了。检查过验证字段都没有错之后开始寻找别的原因。在网上发现原来已经有前辈遇到过类似的麻烦了，原来是scrapy的核心代码里边就把代理的认证字段Proxy-Authorization给扔了…这…我服了。具体的操作可以直接看这篇文章。这里就不多说了。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用爬虫代理时遇到的一些问题

最近各个网站的反爬措施是越来越好了…爬虫也不是那么好做了，原来一直想不使用代理的我也不得不屈服…毕竟一分钟40个页面的频率还要冒着被封ip的风险还是很难受的…Scrapy无法使用代理的问题看了网上很多的的推荐我决定使用讯代理的动态转发服务，十万次转发20块，本着试一试的原则我还是咬咬牙（并没有）买了。按照官方的说明在scrapy里边配置好了（不得不说官方的示例代码是真的烂…），直接开始爬取测试...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。