爬虫之验证码识别–快识别使用教程
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
简介
在一些爬虫模拟登陆请求的时候,除了一些基本的信息参数外,验证码也是必不可少的。
关于验证码的处理方式通常有以下几种方式:
1.人工识别 ## 效率低、识别难道大(譬如12306)
2.打码平台 ## 省心高效,缺点是花钱
3.机器学习 ## 门槛高,当然也可以找开源项目用
一、快识别注册及简单介绍
作为众多打码平台之中的一个,我觉得它好处就是简单、低价
注册链接快识别
其中带’*‘号的是必填参数,当然我的推荐码是(8e0c305854654d60a8bda36f7d5007cc)
项目价格
充值
价格十分的低普通的图片字符验证1块钱500次,可以充值1元测试(只支持支付宝充值)
二、使用说明
这里是官方发开文档的接口说明
http://www.kuaishibie.cn/docs/index.html?spm=null
还有一个是最新的接口文档
https://shimo.im/docs/yXJvpVQDRTpDxp8c
接口里包括常用的爬虫编程语言python,Java,易语言等等
可能接口会更新 建议使用最近的接口文档提供的识别接口
1.python使用
改进之后的接口及说明`
import base64
import json
import requests
def base64_api(uname, pwd, img):
with open(img, 'rb') as f:
base64_data = base64.b64encode(f.read())
b64 = base64_data.decode()
data = {"username": uname, "password": pwd, "image": b64}
result = requests.post("http://api.ttshitu.com/base64", json=data).json()
if result['success']:
return result["data"]["result"]
else:
return result["message"]
if __name__ == "__main__":
img_path = 'yam.jpg'
result = base64_api(uname='用户名', pwd='密码', img=img_path)
print(result)
实际的过程就是将本地的验证码图片以post
请求发送给网站接口,其中post
的data
需要为base64
格式的以json
传入接收也是json
格式的最后取取出
总结
简简单单的使用,还需要根据具体的需要改下。
学习验证码的视频bilibili