爬虫爬取免费代理ip,验证代理ip有效性,保存到本地txt,建立代理池

本文介绍了如何使用多线程、队列和正则表达式爬取免费代理IP,通过验证IP的有效性,将有效的代理IP保存到本地TXT文件,从而创建一个自己的代理IP池。
摘要由CSDN通过智能技术生成

爬虫爬取免费代理ip,验证代理ip有效性,保存到本地txt,建立代理池

使用多线程+队列+正则匹配,对免费代理ip网站和查询自身ip网站(验证代理ip是否有效)发送请求,如果代理ip为有效,保存至本地txt文件中,建立自己的私人有效代理ip池。

源码:

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import requests
import threading
from queue import Queue
import re
from bs4 import BeautifulSoup as bs

# 获取代理ip地址网址
# http://www.xsdaili.cn/dayProxy/ip/2749.html

# 验证代理ip是否有效网址
# http://www.5dip.com/5dip/QueryIp.aspx

headers = {
   
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36'}

ip_lists = []


class Spider(threading.Thread):
    def __init__(self, queue):
        threading.Thread.__init__(self)
        self.queue = queue
        self.spider_website()

    # 爬取网上免费代理ip的方法
    def spider_website(self):
        while not self.queue.empty()
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值