验证码识别的原理python_蓝奏云数值验证码识别,python调用虹鱼图灵识别插件,超高正确率...

本帖最后由 打字的小强 于 2020-6-5 13:11 编辑

识别验证码一直是本人想要做的事情,一直在接触按键精灵,了解到有一个虹鱼图灵识别插件专门做验证码和图像识别,原理就是图片处理和制作字库识别,制作字库我一直觉得很麻烦,工程量太大。不管怎样,它能够达到我的目的,并且比机器学习,opencv是要简单点,那我就讲讲这个虹鱼图灵识别插件。

先亮一下成果勾引,嘿嘿

codes.gif (434.76 KB, 下载次数: 0)

2020-6-5 11:44 上传

一.收集验证码图片。

就找一个最常见的蓝奏云的下载输入的验证码。fiddler抓一下,说一下这个验证码特征,都是数字,1-4个数字,没有旋转,没有在一行,有干扰直线,有干扰点。

QQ截图20200605101518.png (88.69 KB, 下载次数: 0)

2020-6-5 10:16 上传

QQ截图20200605101528.png (19.73 KB, 下载次数: 0)

2020-6-5 10:16 上传

找到链接了,接下来写代码,这个验证码图片接口,没有任何反爬。新建一个save_img.py,新建两个文件夹,一个做字库,一个做验证集。一个100张。先爬两百张图片。

[Python] 纯文本查看 复制代码import requests

urls = "https://vip.d0.baidupan.com/file/imagecode.php"

for i in range(100):

datas = requests.get(urls)

with open('./verify/'+str(i)+'.png', 'wb') as file:

file.write(datas.content)

二.处理图片,制作字库

预先说明,虹鱼图灵识别插件跟大漠一样,只能用32位的python调用,建议用conda新建python3.7 32位的python虚拟环境,cmd进入环境安装相关包,不要在

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值