python爬虫防止IP被封的一些措施,强烈建议收藏转发

最新推荐文章于 2023-12-30 15:07:30 发布

不想秃头的晨晨

最新推荐文章于 2023-12-30 15:07:30 发布

阅读量5.5k

点赞数 10

分类专栏： python 爬虫基础入门文章标签： python 后端爬虫

本文链接：https://blog.csdn.net/chenchen5152/article/details/117562274

版权

python爬虫防止IP被封的一些措施

1.爬虫防止IP被封的一些措施
2.伪造User-Agen
3.在每次重复爬取之间设置一个随机时间间隔
4.伪造`cookies`
5.使用代理

1.爬虫防止IP被封的一些措施

在编写爬虫爬取数据的时候，因为很多网站都有反爬虫措施，所以很容易被封IP，就不能继续爬了。在爬取大数据量的数据时更是瑟瑟发抖，时刻担心着下一秒IP可能就被封了。

本文就如何解决这个问题总结出一些应对措施，这些措施可以单独使用，也可以同时使用，效果更好。

2.伪造User-Agen

在请求头中把User-Agent设置成浏览器中的User-Agent，来伪造浏览器访问。比如：

headers = {
   'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'}
resp = requests.get(url,headers = headers)

还可以先收集多种浏览器的User-Agent，每次发起请求时随机从中选一个使用，可以进一步提高安全性：

In [7]: import requests,random

In [8]: user_agents = ['Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1','Mozilla/5.0 (Windows; U; Windows NT 6.1; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50','Oper

最低0.47元/天解锁文章

不想秃头的晨晨

关注

10
点赞
踩
64

收藏

觉得还不错? 一键收藏
0
评论
python爬虫防止IP被封的一些措施,强烈建议收藏转发

1.python爬虫防止IP被封的一些措施在编写爬虫爬取数据的时候，因为很多网站都有反爬虫措施，所以很容易被封IP，就不能继续爬了。在爬取大数据量的数据时更是瑟瑟发抖，时刻担心着下一秒IP可能就被封了。本文就如何解决这个问题总结出一些应对措施，这些措施可以单独使用，也可以同时使用，效果更好。2.伪造User-Agen在请求头中把User-Agent设置成浏览器中的User-Agent，来伪造浏览器访问。比如：headers = {'User-Agent':'Mozilla/5.0 (X11; Li
复制链接

扫一扫