各个平台搜索关键词就可以找到不同品牌的代理IP了。
找倒是不难,难的是能从中挑选出靠谱且合适的代理品牌。
在选择代理IP这块,不建议使用免费和超低价的代理,因为这一类的代理往往非常不稳定,很多都被网站拉黑过,特别是题主要使用代理IP进行爬虫的,会导致爬虫频繁出现链接等问题,效率很低。
最可怕的是免费和低价代理IP很大概率存在安全问题,比如盗取你的资料等,这可就不是小事了。
这类代理IP为什么会有那么多的问题呢?
其实这主要是因为正规的IP申请流程非常的复杂,这个过程中要付出的人力、物力、财力都是我们没法相像的。那么免费、低价的代理很多是另有所图,不要被有心人抓了把柄。
回到题主的第二个问题:python爬虫必须要高匿IP吗?
结论:不一定,但建议用高匿IP。
高匿名代理相比平常的普通匿名代理,它更难被目标服务器检测到,匿名性更强,就像是一个普通的用户直接访问目标网站,效率当然是更高的。
目前的目标网站大部分都是有较为严格的反爬机制,使用非高匿名代理可能会增加被封锁的风险,
这就说明如果只是用于简单的数据抓取,且目标网站没有严格的反爬虫策略,才能够冒险用用非匿名,但这度我们很难拿捏,所以这个险咱们不建议冒。