12306登录验证码识别

最近在研究12306验证码识别,前期的12306查询验证码识别已经上线了,详见http://download.csdn.net/download/ghost_man_/10160932的博客,里面的12306查询验证码已经上线了,可以去体验一下;

      针对12306的登录验证码(问题、图片识别)现在demo已经完成了(正确率已达90%),再过一周我就把这做成一个服务,供大家调用;

      现在将12306的登录验证码的识别过程在这篇博客里面介绍一下:

      12306登录验证码的识别主要分为3个部分:问题识别、图片识别、问题的基础上对图片进行识别

      问题识别:12306的问题识别上主要体现在,问题部分是单个问题、两个问题,首先需要对问题进行切割,在处理切割问题上,主要采用数字图像处理的方式,对问题中间的缝隙进行识别,确定中间的间隙的问题位置信息,对问题进行切割,这样就可以合理地切割问题了;

      图片识别:对于从12306上面爬取下来的图片,从图片中可以确定8张图片的位置信息,从而可以整张图片上对8张图片进行切割;

      到目前为止问题图片、验证种类图片已经能够分开了,随着抓取图片的不断增多,为后面的训练、识别做好准备;

      在识别的过程中,我通常采用tensorflow框架进行训练,在这个过程中,主要是训练集的制作比较麻烦(训练集打码);

      训练的架构采用的5层网络结构进行训练,分类;


      主要问题点:

      1. 对于12306登录验证码的抓取,通常采用ip代理的进行抓取,不然12306对频繁访问的ip进行封掉;

      2. 打码的过程比较艰辛,量比较大;

      3. 对于整个工程进行集成;

12306登录图形验证码已经上线:12306图形验证码功能已经上线了,下载地址:http://download.csdn.net/download/ghost_man_/10199475


     交流QQ:1827688298 有关12306验证码的问题大家都可以探讨

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值