2021-01-23

爬虫之验证码识别–快识别使用教程

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


简介

在一些爬虫模拟登陆请求的时候,除了一些基本的信息参数外,验证码也是必不可少的。
关于验证码的处理方式通常有以下几种方式:
1.人工识别 ## 效率低、识别难道大(譬如12306)
2.打码平台 ## 省心高效,缺点是花钱
3.机器学习 ## 门槛高,当然也可以找开源项目用

一、快识别注册及简单介绍

作为众多打码平台之中的一个,我觉得它好处就是简单、低价
注册链接快识别
其中带’*‘的为必填参数
其中带’*‘号的是必填参数,当然我的推荐码是(8e0c305854654d60a8bda36f7d5007cc)
项目价格
价格
充值
在这里插入图片描述
价格十分的低普通的图片字符验证1块钱500次,可以充值1元测试(只支持支付宝充值)

二、使用说明

这里是官方发开文档的接口说明
http://www.kuaishibie.cn/docs/index.html?spm=null
还有一个是最新的接口文档
https://shimo.im/docs/yXJvpVQDRTpDxp8c
接口里包括常用的爬虫编程语言python,Java,易语言等等
可能接口会更新 建议使用最近的接口文档提供的识别接口

1.python使用

接口文档
改进之后的接口及说明`

import base64
import json
import requests


def base64_api(uname, pwd, img):
    with open(img, 'rb') as f:
        base64_data = base64.b64encode(f.read())
        b64 = base64_data.decode()
    data = {"username": uname, "password": pwd, "image": b64}
    result = requests.post("http://api.ttshitu.com/base64", json=data).json()
    if result['success']:
        return result["data"]["result"]
    else:
        return result["message"]


if __name__ == "__main__":
    img_path = 'yam.jpg'
    result = base64_api(uname='用户名', pwd='密码', img=img_path)
    print(result)

实际的过程就是将本地的验证码图片以post请求发送给网站接口,其中postdata需要为base64 格式的以json 传入接收也是json格式的最后取取出

总结

简简单单的使用,还需要根据具体的需要改下。
学习验证码的视频bilibili

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值