不会深度学习的你如何实现验证码的高质量识别

前言:
在很多爬虫的自动化项目中,我们难免会遇到一些需要处理验证码的问题,其中一种解决方案就是通过手动输入,但这样效率却很慢,有没有什么方法能帮助我们自动识别呢?当然又,那就是打码平台,这里我推荐打码狗平台,识别率很高,并且便宜,但是还是希望大家也包括我后来能通过深度学习的方式,建立起自己的一套识别体系,废话不多说,那么就开始吧!!!

不想看分部分介绍直接拉到最下面修改配置即可食用

简单介绍打码狗平台(没有广告钱)

可以看一下下面这个介绍,然后大家注册一下,充值积分,特别便宜我记得我那个1元钱都用了好几个月都还没用完
在这里插入图片描述

Python代码实现

这里我创建了一个captchaRecognize类,我将分别对类中每个部分进行讲解,

初始化

因为,打码平台没有反爬机制,所以简单下了一个User-Agent上去,加了一个判断条件,判断是否有有效的session传入

    def __init__(self, s):
        if s is None:
            self.s = requests.session()
        else:
            self.s = s
        self.headers = {
   
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3754.400 QQBrowser/10.5.4034.400',
        }

获取打码平台UserKey

这个UserKey唯一标志了你的身份

# 用于获取打码平台UserKey
    def get_userKey(self, ):

        get_url = f"http://www.damagou.top/apiv1/login.html?username={username}&password={password}"
        try:
            r = requests.get(get_url, headers=self.headers)
            r.raise_for_status()
            r.encoding = r.apparent_encoding
            print("Dmagou Being Processing"
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值