为什吗python要进行UA伪装?
首先UA是什么ua就是User-Agent这个就是请求载体的身份标识如果我们用浏览器发送请求就意味着当前的url使用浏览器进行打开的请求载体是浏览器而在python中我们发送请求的方式发是requests.get发送请求虽然也能发送请求这个时候url的载体并不是浏览器而是pyhon这个就是浏览器请求方式的唯二两种(如果说的不对评论区纠正毕竟萌新新手上路)一般的门户网站会检测你的请求方式是浏览器还是python所对应的载体身份标识。
如果检测到载体是浏览器的话为正常请求,正常请求就是用户通过浏览器进行的请求服务器端不会拒绝该请求。
另一种情况检测到不是浏览器请求的话维二性所以说请求载体不是某一款浏览器请求不正常推一波就是爬虫服务器端就有可能会拒绝请求。
简单来说UA伪装就是防止被检测出来是爬虫而被拒绝访问
UA伪装到底是什么样呢
这里就是ua正常的请求
这个是我们python伪装的请求这个请求可以改成顶上的UA
这个是i请求请求的地址和伪装的UA
总结:UA伪装让爬虫的请求载体身份伪装成某一款浏览及然后避开检测爬取数据