python实现http代理客户端_利用Python实现简单HTTP代理验证

原创作品:首发u3v3, 转载请保留

作者ID:noomrevils

首发日期:2017.3.5

Python学习群:278529278 (欢迎交流)

前言

需求

相信用python写过爬虫的人都有听说或使用过代理的经历,网络上提供了很多免费的代理,也有很多收费代理提取接口,但是实际在使用这些代理的时候,往往会有速度慢,无法连接,非高匿,插入广告或统计代码等种种问题,本文的初衷就是提供一个验证代理的思路和简版的代码实现,通过定时的任务可以验证代理的有效性,维护一个可用的代理池。

思路

为了实现验证的功能,需要有一个页面能够展示通过代理的请求信息,比如说,ip地址,请求头。

这些信息可以帮助判断代理是否高匿,同时检查这个页面返回html, 可以知道,代理是否向其中添加了额外的信息(广告,统计)

然后在client端,我们通过代理请求这个页面,解析返回的页面内容,完成代理可用性的验证

验证接口&页面实现

处理请求函数

Python的Web框架选用的是Bottle, 简单但能够说明问题。

from bottle import request, route, run, template

@route('/')

def index():

headers = {}

for key in request.headers.keys():

headers[key] = request.he

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值