1、 什么是代理?
透明代理IP 匿名代理IP 高匿代理IP(一般都是使用的高匿代理)
2、代理包括:
① 透明代理:服务器知道你用了代理IP,也能获取你的本机IP
② 匿名代理:服务器知道你用了代理,获取不了你的本机IP
③高匿代理:服务器不知道你用了代理,并且不能获取你的本机代理
3、为什么要使用代理IP?
在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力,所以你一直用同一个代理IP爬取这个网页,很有可能IP会被禁止访问网页。
所以基本上做爬虫的都躲不过去IP的问题,需要很多的IP来实现自己IP地址的不停切换,达到正常抓取信息的目的。
4、代理IP的获取,可以从以下几个途径得到:
从免费的网站上获取,质量很低,能用的IP极少。但是从实用性,稳定性, 安全性,来考虑不推荐大家使用免费IP