一 最基本的User-Agentyan验证
如果通过程序向目标网站发送请求且不设置任何请求参数,服务器得到请求会识别为非人为通过浏览器请求,这种情况下大可能会被浏览器拒绝请求。(请求状态码非200,服务器拒绝访问)
设置请求头headers-UA参数:
headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36' }
基本的headersUA参数。
如果我们需要请求大批量的数次,使用同一个浏览器和同一个环境设备,User-Agent基本不会变的。一些网站服务器反爬手段敏感强度高,也会拒绝访问。
在python中可以使用一个第三方库获取UA数值:
进入终端输入: pip install faker.
安装完成后实例对象: