python:构建代理ip池

2 篇文章 0 订阅
本文介绍了如何使用Python爬取代理网站,验证代理IP的有效性,并将有效代理存入本地文件,以便后续使用。
摘要由CSDN通过智能技术生成
  • 上篇文章写了一下如何验证代理ip 是否有效,
  • 这一篇实现可以爬取代理ip网站的IP,验证有效并写入我的本地文件
import time
from selenium import webdriver
import requests

ip_file = r'C:\Users\Administrator\Desktop\代理IP.txt'

ip_url = "https://www.zdaye.com/dayProxy/2019/11/1.html"
browser = webdriver.Chrome()
browser.implicitly_wait(10)
browser.get(ip_url)

divs = browser.find_elements_by_xpath('//div[@class="thread_posts_list"]//div[@class="thread_item"]')
time.sleep(2)
divs[0].find_element_by_class_name('thread_tags').click()
time.sleep(3)
result = browser.find_element_by_class_name('cont').text
for i in result.split('\n'):
    ip_one = i.split('@')[0]

    try:
        proxies = {'http':ip_one}
        res = requests.get("http://icanhazip.com/",proxies=proxies,timeout=6)
        # print(ip_one.split(':')[0])
        # print(res.text)
        if ip_one.split(':')[0] == res.text.strip():

            print('该ip地址{}是correct啊, 老大你可以保存一下'.format(ip_one))
            with open(ip_file,'a+',encoding='utf-8') as f:
                f.write(ip_one+'\n')
        else:
            print('这个ip地址{}不合法啊, 老大'.format(ip_one))
    except Exception as e:
        print('请求都出现错误,这个ip地址{}真的是垃圾啊,老大'.format(ip_one))
  • 查看结果:
    在这里插入图片描述
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值