python 代理ip验证_python如何抓取代理IP并且验证是否有效?

本文介绍了如何使用Python从网站抓取免费代理IP,并通过多线程验证其有效性。虽然免费代理IP效率不高,但通过多线程验证可以提高效率。文章还提示,虽然免费代理IP可能增加时间成本,但购买高质量代理IP能提升工作效率。
摘要由CSDN通过智能技术生成

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼

尽管知道免费代理IP有效率并不怎么好,但毕竟是天上掉下来的馅饼。还是有很多人去爬取免费代理IP用来做爬虫的,不过也得减缓爬取速度,避免影响人家网站的正常运行。

那么问题来了,如何抓取免费代理IP呢?又如何多线程验证代理IP是否有效呢?

一、抓取代理IP

首先找一个提供免费代理IP的网站,这个网上有很多,这里就不举例说明了。

import urllib.request

import urllib

import re

import time

import random

#抓取代理IP

ip_totle=[] #所有页面的内容列表

for page in range(2,6):

url='http:http://www.***.com/***/'+str(page)

headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64)"}

request=urllib.request.Request(url=url,headers=headers)

response=urllib.request.urlopen(request)

content=response.read().decode('utf-8')

print('get page',page)

pattern=re.compile('

(\d.*?)') #截取与之间第一个数为数字的内容

ip_page=re

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值