User-Agent:简称UA,它是一个特殊的字符串头,可以使服务器识别客户使用的操作系统及版本、浏览器及版本等信息。在做爬虫时加上此信息,可以伪装为浏览器;如果不加,很可能会被识别出为爬虫。
确定自己浏览器的User-Agent信息:
步骤如下:
- 首先打开你的浏览器(本人使用的是google浏览器百度搜索引擎)输入:
about:version

- 输入后,浏览器会跳出图中的界面,蓝色标出的“用户代理”一行就是浏览器的
User-Agent。

- 当python要浏览网页时,按图中
headers的方法,即可获得浏览器的权限。

本文详细介绍了User-Agent的作用,它是如何帮助服务器识别客户端信息的,以及在爬虫开发中如何利用User-Agent进行伪装。同时,提供了检查自己浏览器User-Agent信息的方法。
6348

被折叠的 条评论
为什么被折叠?



