python写的代理IP抓取与测试工具

项目结构:
在这里插入图片描述

Multirun是多线程相关代码。

Task是任务封装。

MultiTaskRun.py是线程启动与任务封装。

主要业务相关代码在Proxy中。
conf.py是数据库配置。
db_public.py是数据查询与写入的代码。
Pool是池子,主要用于减少数据库连接与断开的次数。
Http.py简易的封装了http请求,使用起来方便一些。
Proxy.py主要是各个代理网站的爬取方式。

proxy2.sql是数据库结构。

项目从RunProxy.py启动

if __name__ == "__main__":
    # 对已有的IP进行测试
    q = db_public.get_proxy2_ip_queue()
    MultiTaskRun.multi_thread_run_base_task(q, test_proxy, 4 * cpu_count())

    # 找新的IP并入库
    q = queue.Queue()
    tn = 6  # type
    for x in range(0, tn):
        q.put(x)
    MultiTaskRun.multi_thread_run_base_task(q, find_new_proxy, tn)

git 地址:git@gitee.com:user.zt/Proxy.git

csdn资源 https://download.csdn.net/download/x82488059/12036103从这里下载需要积分。

注意conf.py并没有上传到git,下面是conf.py的代码。conf.py位于Proxy文件夹下。
conf.py

#!/usr/bin/python3
# -*- coding: utf-8 -*-
db_charset = 'utf8'
db_public = 'dbname'
db_public_host = '127.0.0.1'
db_public_user_name = 'root'
db_public_user_pwd = 'pwd'
db_port = 3306

好用的话,请点个赞支持下!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值