装饰器应用之校验代理IP

RunnerJxc

于 2020-07-07 22:20:42 发布

阅读量440

点赞数

分类专栏： python实用特性文章标签： python proxy 装饰器代理校验

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Dick633/article/details/107189640

版权

使用代理IP，是数据爬取过程中最常用的反爬手段之一。
有经费的，可以订购代理ip提供商的套餐使用，没有的也不担心，许多网站通常都提供了较多的免费代理来吸引客户。我们可以抓取这些免费的代理，来构建自己的代理IP池。
将代理抓取到本地后，因为免费的时效性都较短，所以需要进行二次校验。这一步，你可以定义一个通用的函数，或者，使用更简洁高效的装饰器。
校验分两步：

正则校验代理ip的格式是否正确
requests添加代理请求目标网站，检验代理是否有效

实例如下：

from functools import wraps
import re
import requests
#目标网址
CHECK_URL = 'https://www.baidu.com'
#请求头
HEADERS = {
   'User-Agent': 'Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11'}
#请求超时设置/秒
TIMEOUT = 5

'''
 ip格式检测装饰器
:param ip:代理ip
:param port:代理端口
'''
def check_proxy_format(func):
    @wraps(func)
    def format_wrapper(*args,**kwargs):
        ip,po

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
装饰器应用之校验代理IP

使用代理IP，是数据爬取过程中最常用的反爬手段之一。有经费的，可以订购代理ip提供商的套餐使用，没有的也不担心，许多网站通常都提供了较多的免费代理来吸引客户。我们可以抓取这些免费的代理，来构建自己的代理IP池。
复制链接

扫一扫

专栏目录

RunnerJxc CSDN认证博客专家 CSDN认证企业博客

码龄9年

72: 原创

23万+: 周排名

166万+: 总排名

33万+: 访问

: 等级

2169: 积分

112: 粉丝

152: 获赞

115: 评论

723: 收藏

私信

关注

分类专栏

最新评论

【linux系统故障】-网卡消失
我不是运维工程师: 网卡重启后可以用了，但是系统重启后又down掉了，这是什么问题
【openstack】无法访问身份管理下的项目、用户、组的解决办法
刘Kx: 能好吗，为什么我也是这个问题，和你一样找不到第三个，但是我好像重启失败了
Centos更改yum、epel为国内源
yuki_2000: 谢谢你解决了我的问题
【openstack】无法访问身份管理下的项目、用户、组的解决办法
我叫凉音: 这里边需要说一嘴，2.1操作里进行WEBROOT=‘/dashboard’的操作中的前两个文件没什么好说的，直接按路径找到修改就行了。主要的是第三个文件，我找到了文件的父路径也就是在js下，我没找到相同名称的js文件所以我就挨个打开查看，在文件中搜索的过程中发现有只有一个文件里的WEBROOT是大致符合要匹配的格式的，所以大胆修改了一下，后面按照博主的方式修改完，重启服务问题就解决了。不过第一次输网址忘记加/dashboard了，加上就好了
【openstack】无法访问身份管理下的项目、用户、组的解决办法
m0_65170147: 能不能问一下为什么需要这么操作吗 Y版本的这么操作无法进入没有Djano文件

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。