本教程仅供学习,不会提供任何可直接使用的模型和程序
使用深度学习框架Keras
python版本3.6
验证码主要是用于智能区分人机。而爬虫一部分得工作就是模拟人得行为去浏览。
自然就站在了对立面
今天带大家练习得是还在广泛使用的,定长型字符验证码
这个是支付宝得官网的登录验证码
而我们需要做的就是
自动化的识别验证码内容
既然使用到了深度学习,就需要先准备训练集
因为我这边已经有一个模型了,所以准备训练集的过程会简单很多,(但是大多数情况需要手动标注而且量需要数千上W才会有较好的效果或)
链接:https://pan.baidu.com/s/1Czw6sMjr3a7zqrrvvQ5JAg
提取码:27ks
站内下载地址
下载验证码的爬虫python代码,可以参考
'''
支付宝验证码下载程序
'''
import requests
import time
import uuid
savePath = 'E:/captcha/alipay/'
for i in range(1