python requests 爬取代理ip并验证(快代理&西祠代理)

本文介绍了如何使用Python的requests库结合XPath从快代理和西祠代理网站抓取免费代理IP,并进行有效性验证。由于网站可能进行优化,建议定期检查并更新XPath路径。代码部分受到他人启发,若原作者看到,请联系作者添加引用链接。
摘要由CSDN通过智能技术生成

**

爬取代理ip并验证(快代理&西祠代理)

**

最近公司有些爬虫需求,有爬虫,就需要有代理IP池(为什么需要?自己想。),但是吧,只能用免费的,原因都懂,那来吧!

  • 快代理:https://www.kuaidaili.com/free/inha/1/
  • 西祠代理:http://www.xicidaili.com/nn/1/(我今天发现登不上,代码也贴上吧,赠人玫瑰,手有余香!)
  • 快代理

快代理


# 快代理
import requests
from lxml import etree



# 将能用的代理IP追加到文件
def write_proxy(proxies):
    print(proxies)
    for proxy in proxies:
        with open("./1688-data/ip_proxy.txt", 'a+') as f:
            print("正在写入:", proxy)
            f.write(proxy + '\n')
    print("录入完成!!!")


# 解析网页,并得到网页中的代理IP
def get_proxy(html):
    selector = etree.HTML(html)
    proxies = 
  • 5
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值