验证码论文概述-----中文篇

一下论文的已打包上传(https://download.csdn.net/download/mr_tianyanxiaobai/11587329)

《 高效的验证码识别技术与验证码分类思想》

-2009年
总结
这是一篇很早之前的论文,作者这篇论文解决的是字母和数字黏合的验证码,如下图:
在这里插入图片描述
方法: 尽管上面的这四种验证码是很早之前的,不过至今也还在用。本篇论文采用的方法就是现在很熟知的传统方法:二值化,去燥,分割,传统机器算法(且在论文中用到了彩色滤波的方法去除噪点)。
结果: 如下,当然如果针对于现在的前100,肯定就不得行了。选该篇论文开头的原因是因为该篇论文算的上是验证码识别中较早。从该篇论文我们就可以看出传统的验证码识别方法其实在早在09年就已经被提出来了。
在这里插入图片描述

《验证码识别系统的研究与实现》

-2010
解决问题: 对数字+字母+噪点+下划线的验证码进行识别
技术创新: 该篇论文出自于10年,而这个时候对于验证码的识别已经出现了神经网络,该篇论文便就是在传统的提取数据特征的基础上了,利用BP神经网络来训练模型。其中最值得说一下的创新点是:作者利用到了 遗传算法。作者认为传统BP中的梯度算法优化参数,只能找到局部最优,而该篇论文利用遗传算法代替梯度下降寻找全局最优

《卷积神经网络在验证码识别上的应用与研究》

-2016
拟解决的问题
对如下的四字成语进行识别:
在这里插入图片描述
其中的数据集来源为
在这里插入图片描述
与其他论文的不同
不同的验证码图片的特点以及差异性较大,这使得传统的验证码识别比较依赖与数据预处理进而导致推广性很差。该篇论文解决问题的思路的大致步骤同上,将每张图片的汉子切割成一张张小图片,然后放到卷积神将网络中跑,进而训练出比较好的模型。在整个步骤中提出的好的想法,如下:

  • 在图片进行二值化处理前,先用中值滤波消除汉字之间的颜色差异
  • 利用k-means算法来判断图片应该从哪里开始切割,聚类后的图如下所示:

    这样做可以,减少自定义切割坐标,而带来的切割出来的图像不理想的情况
  • 增加了一个拓展训练集的操作:将切割好的图片,按照任意角度进行旋转,生成更多的训练集也致使卷积学习到的模型抗噪声,抗扭曲等特点。

卷积结构
在这里插入图片描述
结果
在这里插入图片描述

《卷积神经网络识别汉字验证码》

2018
问题描述
本文主要描述的类似与qq找回中心验证码的一种识别方式,具体样例如下:
在这里插入图片描述
数据集来源:根据现有网站的验证码特征,然后自己生成带标签的数据集
解决思路
首先将大图中的每个字分割下来进行处理,然后放到神经网络里边去做预测;再将小图中的每个字分割下来进行处理做预测,然后将大小图的预测值进行匹配(计算两个预测矩阵的最短欧几里德离),匹配成功则返回大图坐标,点击即可
网络结构
在这里插入图片描述
实验主要包含了10个卷积层,4个池化和一个全连接
结果
在这里插入图片描述
优点
该篇论文在继承上一篇

  • 对训练数据进行扭曲,旋转,背景噪声来增加模型鲁棒性。且该篇论文
  • 对于汉字的分割以及处理采用HSV与边缘检测结合的方法
  • 分别需将小图和大图都进行分割,然后利用欧几里得距离来判断两张图的相似度。(这里或许可以尝试一下其他的相似度判断方法:余弦相似度,图片的hash值。。。)
  • 还有一个缺点就是本文缺少对CNN结构为什么这样设计的详细阐述

《基于卷积神经网络的图像验证码识别》

解决的问题
本文主要解决教务系统和铁路购票网站验证码这两种图片的识别问题,如下所示:
在这里插入图片描述
在这里插入图片描述
数据集的来源没有明确给出,可能存在两张方式:爬虫+人工标签或者自己生成和目标验证码类似的验证码集合。
与传统卷积的不同

  • 整个网络由级联卷积,残差以及分类池化层构成

    • 级联卷积层有若干个33卷积核和一个池化层构成,用以减少卷积参数。(文中利用参数的计算公式证明了,3个33的卷积核与一个7*7的卷积核邮政同样的感受野,但是参数个数要少接近一半,且每一个卷积层后面加入一个激活层,增加了网络对非线性的拟合能力)
    • 残差:解决梯度消失的问题
    • 分类池化层:代替最后一次全连接层,减少参数
  • 引入了分组卷积的思路用以减少参数
    在这里插入图片描述

  • 具体网络结构如下:
    在这里插入图片描述

中文篇总结

  1. 看了多篇中文论文之后,首先不得不承认很多我们本以为很前沿的技术其实已经很老了(比如传统个验证码识别方法)。
  2. 利用旋转,翻转等方法对数据集进行拓展,可以更好好的提高模型的泛化性
  3. 可以利用一些较小的cov和分组卷积,全局池化等操作来减少模型的超参数。
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值