python 验证码识别端到端

TensorFlow练习20: 使用深度学习破解字符验证码

验证码是根据随机字符生成一幅图片,然后在图片中加入干扰象素,用户必须手动填入,防止有人利用机器人自动批量注册、灌水、发垃圾广告等等 。

验证码的作用是验证用户是真人还是机器人;设计理念是对人友好,对机器难。

TensorFlow练习20: 使用深度学习破解验证码

上图是常见的字符验证码,还有一些验证码使用提问的方式。

我们先来看看破解验证码的几种方式:

  1. 人力打码(基本上,打码任务都是大型网站的验证码,用于自动化注册等等)
  2. 找到能过验证码的漏洞
  3. 最后一种是字符识别,这是本帖的关注点

我上网查了查,用Tesseract OCR、OpenCV等等其它方法都需把验证码分割为单个字符,然后识别单个字符。分割验证码可是人的强项,如果字符之间相互重叠,那机器就不容易分割了。

本帖实现的方法不需要分割验证码,而是把验证码做为一个整体进行识别。

相关论文

使用深度学习+训练数据+大量计算力,我们可以在几天内训练一个可以破解验证码的模型,当然前提是获得大量训练数据。

获得训练数据方法:

  1. 手动(累死人系列)
  2. 破解验证码生成机制,自动生成无限多的训练数据
  3. 打入敌人内部(卧底+不要脸+不要命+多大仇系列)

我自己做一个验证码生成器,然后训练CNN模型破解自己做的验证码生成器。

我觉的验证码机制可以废了,单纯的增加验证码难度只会让人更难识别,使用CNN+RNN,机器的识别准确率不比人差。Google已经意识到了这一点,他们现在使用机器学习技术检测异常流量。

验证码生成器

TensorFlow练习20: 使用深度学习破解字符验证码
左上角文本对应验证码图像

TensorFlow练习20: 使用深度学习破解字符验证码

训练

CNN需要大量的样本进行训练,由于时间和资源有限,测试时我只使用数字做为验证码字符集。如果使用数字+大小写字母CNN网络有4*62个输出,只使用数字CNN网络有4*10个输出。

TensorBoard是个好东西,既能用来调试也能帮助理解Graph。

训练完成时的准确率(超过50%我就不训练了):

TensorFlow练习20: 使用深度学习破解字符验证码

使用训练的模型识别验证码:

TensorFlow练习20: 使用深度学习破解字符验证码

loss和准确率曲线:

为了成为真正的码农,本熊猫要开始研习TensorFlow源代码了,应该能学到不少玩意。

如要转载,请保持本文完整,并注明作者@斗大的熊猫和本文原始地址: http://blog.topspeedsnail.com/archives/10858

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
你好!关于Python验证码识别,我可以给你一些建议和指导。 首先,验证码识别是一个广泛应用的领域,也是一个挑战性的任务。在Python中,你可以利用一些库和工具来实现验证码识别。 1. 使用图像处理库:Python中有很多图像处理库可供选择,如OpenCV、PIL(Pillow)等。你可以使用这些库来对验证码图像进行预处理,如灰度化、二值化、降噪等,以便更好地进行后续的识别。 2. 机器学习算法:对于一些简单的验证码,你可以尝试使用机器学习算法进行识别。常用的算法包括支持向量机(SVM)、随机森林(Random Forest)等。你需要先收集一些已知标签的验证码样本,然后使用这些样本进行模型的训练和测试。 3. 深度学习方法:对于复杂的验证码,尤其是存在干扰线、噪声等情况下,传统的机器学习算法可能效果不佳。这时你可以考虑使用深度学习方法,如卷积神经网络(CNN)。你可以使用一些深度学习框架,如TensorFlow、Keras、PyTorch等,来实现验证码的训练和识别。 另外,你可能还需要考虑一些验证码的特殊情况,比如旋转、扭曲、遮挡等。对于这些情况,你可以尝试使用图像增强技术来改善识别效果。 总之,验证码识别是一个复杂的任务,需要结合图像处理、机器学习和深度学习等技术进行处理。希望以上建议对你有所帮助!如有任何进一步的问题,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值