二. 加载fake_useragent库,随机生成User-Agent添加到headers中
代码示例:
from fake_useragent import UserAgent# 测试fake-useragentua = UserAgent()print(ua.random)
2 基于IP反爬
![13ab941d3df421d5851fda066ff71c46.png](https://img-blog.csdnimg.cn/img_convert/13ab941d3df421d5851fda066ff71c46.png)
简介: 爬虫程序可能会在短时间内对指定的服务器发起高频的请求。后台服务器对访问进行统计,单位时间内同一IP访问的次数超过一个特定的值(阀值),就会不同程度的禁封IP,导致无法进行爬虫操作。解决方法:使用代理池,并设定延迟访问
如何获取代理服务器?免费:西祠代理、快代理、goubanjia 收费:代理精灵等代码示例:
# 构建一个代理池ips_list = []url = 'http://t.11jsq.com/index.php/api/entry?method=proxyServer.generate_api_url&packid=1&fa=0&fetch_key=&groupid=0&qty=52&time=1&pro=&city=&port=1&format=html&s