上网用的协议是TCP/IP协议,也就是说你必须有一个IP地址才能访问互联网,上网所必须的每个人的IP地址是唯一的。代理IP呢就是一个跳板,就是说你的本机先访问代理IP,然后通过代理IP地址去访问互联网,这样记录的就是你设置的这个代理的IP地址
Python爬虫之浏览器User-Agent: User Agent中文名为用户代理,是Http协议中的一部分,User Agent也简称UA。它是一个特殊字符串头,是一种向访问网站提供你所使用的浏览器类型及版本、操作系统及版本、浏览器内核、等信息的标识。通过这个标 识,用户所访问的网站可以显示不同的排版从而为用户提供更好的体验或者进行信息统计。 浏览器的UA字串的标准格式:浏览器标识 (操作系统标识; 加密等级标识; 浏览器语言) 渲染引擎标识版本信息。User-Agent':'Mozilla/5.0 (Windows NT 6.1; rv:30.0) Gecko/20100101 Firefox/30.0
适合360浏览器的UA:User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; SE 2.X MetaSr 1.0; SE 2.X MetaSr 1.0; .NET CLR 2.0.50727; SE 2.X MetaSr 1.0)
User-Agent:Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; SE 2.X MetaSr 1.0; SE 2.X MetaSr 1.0; .NET CLR 2.0.50727; SE 2.X MetaSr 1.0)
爬虫使用代理的目的:让服务器以为不是同一个客户端在请求,防止真实客服端地址被泄露。