代理池是什么?怎么获取到代理呢?
- 做爬虫的过程中,需要隐藏自己的ip,这个时候采用固定的ip很容易出现封ip的情况,所以采用代理池的方式,在访问网站的时候,动态的切换代理,可以避免被封账号的问题。
- 正常的服务器肯定不会免费给大家提供端口了,但是总有一些好心的人来提供出一些ip给大家免费试用。
这里主要是通过爬虫的方式进行获取到几个网站的免费的代理ip和端口。
爬去使用到的技术?
- java,jsoup,xpath。
获取的代理一定可用吗?
- 网站获取到的代理会出来不可用的情况,爬去到的代理需要校验后再投入使用哦。
项目地址
https://github.com/yangheng12345/myfirst
如果看动态代理只用看这个文件夹下的代码就可以了,里面已经做好了几家爬去的,没有进行存储。
其中尝试对简书文章进行爬去,发现没有封我的ip,真的是太幸运了,本来还准备用动态代理验证一直访问简书的功能呢。
如果对你有用的话记得点个星哦。
免费的代理网站百度一下就可以出来了。
89免费代理:
http://www.89ip.cn/index_15.html
快代理:
https://www.kuaidaili.com/free/intr/
高速代理:
http://www.iphai.com/free/ng
西刺代理
https://www.xicidaili.com/nn/
三一代理:
http://31f.cn/
有代理:
https://www.youdaili.net/
xx代理
http://ip.yqie.com/proxygaoni/
无忧代理:
http://www.data5u.com/free/index.shtml
国外代理
http://proxydb.net/
https://www.sooip.cn/QQdailiIP/62.html
http://www.cz88.net/proxy/index.shtml
-------下面是参考的
添加抓取更多免费代理网站,目前支持的抓取的免费代理 IP 站点,目前有一些国外的站点连接不稳定
• (国外) http://www.freeproxylists.net/
• (国外) http://gatherproxy.com/
• (国内) https://hidemy.name/en/proxy-list/
• (国内) http://www.ip181.com/
• (国内) http://www.kuaidaili.com/
• (国外) https://proxy.peuland.com/proxy_list_by_category.htm
• (国外) https://list.proxylistplus.com/
• (国内) http://m.66ip.cn
• (国外) http://www.us-proxy.org/
• (国内) http://www.xicidaili.com