爬虫爬取免费代理ip，验证代理ip有效性，保存到本地txt，建立代理池

最新推荐文章于 2024-01-03 21:24:17 发布

j0101_

最新推荐文章于 2024-01-03 21:24:17 发布

阅读量1.7k

点赞数 1

分类专栏： Python网络安全

本文链接：https://blog.csdn.net/jexsen/article/details/114364210

版权

本文介绍了如何使用多线程、队列和正则表达式爬取免费代理IP，通过验证IP的有效性，将有效的代理IP保存到本地TXT文件，从而创建一个自己的代理IP池。

摘要由CSDN通过智能技术生成

爬虫爬取免费代理ip，验证代理ip有效性，保存到本地txt，建立代理池

使用多线程+队列+正则匹配，对免费代理ip网站和查询自身ip网站（验证代理ip是否有效）发送请求，如果代理ip为有效，保存至本地txt文件中，建立自己的私人有效代理ip池。

源码：

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import requests
import threading
from queue import Queue
import re
from bs4 import BeautifulSoup as bs

# 获取代理ip地址网址
# http://www.xsdaili.cn/dayProxy/ip/2749.html

# 验证代理ip是否有效网址
# http://www.5dip.com/5dip/QueryIp.aspx

headers = {
   
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36'}

ip_lists = []


class Spider(threading.Thread):
    def __init__(self, queue):
        threading.Thread.__init__(self)
        self.queue = queue
        self.spider_website()

    # 爬取网上免费代理ip的方法
    def spider_website(self):
        while not self.queue.empty()

最低0.47元/天解锁文章

j0101_

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
3
评论
爬虫爬取免费代理ip，验证代理ip有效性，保存到本地txt，建立代理池

爬虫爬取免费代理ip，验证代理ip有效性，保存到本地txt，建立代理池使用多线程+队列+正则匹配，对免费代理ip网站和查询自身ip网站（验证代理ip是否有效）发送请求，如果代理ip为有效，保存至本地txt文件中，建立自己的私人有效代理ip池。源码：#!/usr/bin/env python# -*- coding: utf-8 -*-import requestsimport threadingfrom queue import Queueimport refrom bs4 import
复制链接

扫一扫