大多数情况下,需要设置请求头。而在请求头中,随机更换User-Agent
可以避免触发相应的反爬机制。使用第三方库fake-useragent
便可轻松生成随机User-Agent
。
以下简单介绍fake-useragent
的安装使用,以及可能出现的问题和解决方法。
安装:
(1) pip install fake-useragent -i https://pypi.doubanio.com/simple
(2)File|setting|下
使用:
from fake_useragent import UserAgent
ua = UserAgent().random
headers = {'UserAgent': ua}
使用fake-useragent的过程中出现了FakeUserAgentError错误。在搜索到的很多解决方法都无效,包括:
禁用服务器缓存:ua = UserAgent(use_cache_server=False)
不缓存数据:ua = UserAgent(cache=False)
忽略 SSL 验证:ua = UserAgent(verify_ssl=False)
更新fake-useragent:pip install -U fake-useragent
发生异常:
原因:
下载是版本不一致哦!
解决:
1. 查看fake_useragent的安装版本
pip list
2. 下载fake_useragent.json文件到本地
1. 打开网页:http://fake-useragent.herokuapp.com/browsers/0.1.11
注意:https无法打开,0.1.11是版本号,可以进行修改,从而下载对应版本号的json文件
2. 右击另存为,把文件名改为 fake_useragent_0.1.11.json ,保存类型为所有文件
注意:下载的json文件名后面的版本号要与当前fake_useragent的版本号保持一致,不一样进行修改,否则后面会出错
3. 把fake_useragent_0.1.11.json文件放到指定的目录中
3.修改为添加一个:path='./fake_useragent_0.1.11.json'
from fake_useragent import UserAgent
ua = UserAgent(path='./fake_useragent_0.1.11.json').random
headers = {'UserAgent': ua}
4.测试