python验证IP代理是否可用

网络爬虫往往会碰到IP被封的尴尬场面,但通过IP代理可以得到解决,但往往免费的IP不稳定,所以使用之前需要验证代理的可用性,现将自己查阅相关资料总结的方法及代码记录以备日后查阅,也供有需要的朋友参阅:

思路如下:

1、在相关免费IP代理的网站获取可用的代理IP以及端口号,存在数据库或者文本,也可不存直接抓取验证使用

2,从抓取的文件或者数据库钟读取IP及端口号和协议

3,使用resqustes.get()设置代理,去尝试访问要抓取的网站,进行验证。

代码如下:

import pandas as pd
import re
import requests

df = pd.read_csv("prox.csv")
t = 0
for i in df.iterrows():
    # print(i[1][0])
    protocol = "https"
    ip = i[1][0]
    port = i[1][1]
    server = ip + ':' + str(port)       
    try:
        r = requests.get('https://www.ipip.net/', proxies={"https": server}, timeout=2)
    except:
        print('connect failed' + ip)
    else:
        # print('success' + server) 
        t += 1
        print('success' + str(re.findall('
   
   
(.*?)
', str(r.text)))) print(str(t))

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值