语音识别卷积神经网络,卷积神经网络字符识别

快乐的小肥熊

于 2022-08-11 12:59:29 发布

阅读量841

点赞数

文章标签： cnn 深度学习神经网络

本文链接：https://blog.csdn.net/shirley67269/article/details/126283236

版权

本文介绍了如何利用Python进行简单的验证码识别，探讨了卷积神经网络（CNN）在字符验证码识别中的优势。文章阐述了从图片预处理、特征提取到模型训练的流程，并对比了不同识别算法的优劣，强调了CNN在图像识别中的重要作用。

摘要由CSDN通过智能技术生成

如何利用Python做简单的验证码识别

1 摘要验证码是目前互联网上非常常见也是非常重要的一个事物，充当着很多系统的防火墙功能，但是随时OCR技术的发展，验证码暴露出来的安全问题也越来越严峻。

本文介绍了一套字符验证码识别的完整流程，对于验证码安全和OCR识别技术都有一定的借鉴意义。

然后经过了一年的时间，笔者又研究和get到了一种更强大的基于CNN卷积神经网络的直接端到端的验证识别技术（文章不是我的，然后我把源码整理了下，介绍和源码在这里面）：基于python语言的tensorflow的‘端到端’的字符型验证码识别源码整理(github源码分享)2 关键词关键词：安全,字符图片,验证码识别,OCR,Python,SVM,PIL3 免责声明本文研究所用素材来自于某旧Web框架的网站完全对外公开的公共图片资源。

本文只做了该网站对外公开的公共图片资源进行了爬取，并未越权做任何多余操作。本文在书写相关报告的时候已经隐去漏洞网站的身份信息。本文作者已经通知网站相关人员此系统漏洞，并积极向新系统转移。

本报告的主要目的也仅是用于 OCR交流学习和引起大家对验证安全的警觉。

4 引言关于验证码的非技术部分的介绍，可以参考以前写的一篇科普类的文章：互联网安全防火墙（1）--网络验证码的科普里面对验证码的种类，使用场景，作用，主要的识别技术等等进行了讲解，然而并没有涉及到任何技术内容。

本章内容则作为它的技术补充来给出相应的识别的解决方案，让读者对验证码的功能及安全性问题有更深刻的认识。

5 基本工具要达到本文的目的，只需要简单的编程知识即可，因为现在的机器学习领域的蓬勃发展，已经有很多封装好的开源解决方案来进行机器学习。

普通程序员已经不需要了解复杂的数学原理，即可以实现对这些工具的应用了。

主要开发环境：python3.5pythonSDK版本PIL图片处理库libsvm开源的svm机器学习库关于环境的安装，不是本文的重点，故略去。

6 基本流程一般情况下，对于字符型验证码的识别流程如下：准备原始图片素材图片预处理图片字符切割图片尺寸归一化图片字符标记字符图片特征提取生成特征和标记对应的训练数据集训练特征标记数据生成识别模型使用识别模型预测新的未知图片集达到根据“图片”就能返回识别正确的字符集的目标7 素材准备7.1 素材选择由于本文是以初级的学习研究目的为主，要求 “有代表性，但又不会太难” ，所以就直接在网上找个比较有代表性的简单的字符型验证码（感觉像在找漏洞一样）。

最后在一个比较旧的网站（估计是几十年前的网站框架）找到了这个验证码图片。原始图：放大清晰图：此图片能满足要求，仔细观察其具有如下特点。

有利识别的特点：由纯阿拉伯数字组成字数为4位字符排列有规律字体是用的统一字体以上就是本文所说的此验证码简单的重要原因，后续代码实现中会用到不利识别的特点：图片背景有干扰噪点这虽然是不利特点，但是这个干扰门槛太低，只需要简单的方法就可以除去7.2 素材获取由于在做训练的时候，需要大量的素材，所以不可能用手工的方式一张张在浏览器中保存，故建议写个自动化下载的程序。

主要步骤如下：通过浏览器的抓包功能获取随机图片验证码生成接口批量请求接口以获取图片将图片保存到本地磁盘目录中这些都是一些IT基本技能，本文就不再详细展开了。

关于网络请求和文件保存的代码，如下：defdownloads_pic(**kwargs): pic_name=('pic_name',None) url='httand_code_captcha/' res=(url,stream=True) withopen(pic_path+pic_name+'.bmp','wb')asf: forchunkinres.iter_content(chunk_size=1024): ifchunk: #filteroutkeep-alivenewchunks f.write(chunk) f.flush() f.close()循环执行N次，即可保存N张验证素材了。

下面是收集的几十张素材库保存到本地文件的效果图：8 图片预处理虽然目前的机器学习算法已经相当先进了，但是为了减少后面训练时的复杂度，同时增加识别率，很有必要对图片进行预处理，使其对机器识别更友好。

针对以上原始素材的处理步骤如下：读取原始图片素材将彩色图片二值化为黑白图片去除背景噪点8.1 二值化图片主要步骤如下：将RGB彩图转为灰度图将灰度图按照设定阈值转化为二值图image=(img_path)imgry=image.convert('L') #转化为灰度图table=get_bin_table()out=imgry.point(table,'1')上面引用到的二值函数的定义如下：呵呵11121314 def get_bin_table(threshold=140): """ 获取灰度转二值的映射table :paramthreshold: :return: """ table = [] for i in range(256): if i

二值化后带噪点的 6937 的像素点输出后如下图：11110001111110001111111000011111000000111110111011110111011111011110111100110111

最低0.47元/天解锁文章

快乐的小肥熊

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
语音识别卷积神经网络,卷积神经网络字符识别

1 摘要验证码是目前互联网上非常常见也是非常重要的一个事物，充当着很多系统的防火墙功能，但是随时OCR技术的发展，验证码暴露出来的安全问题也越来越严峻。本文介绍了一套字符验证码识别的完整流程，对于验证码安全和OCR识别技术都有一定的借鉴意义。然后经过了一年的时间，笔者又研究和get到了一种更强大的基于CNN卷积神经网络的直接端到端的验证识别技术（文章不是我的，然后我把源码整理了下，介绍和源码在这里面）：基于python语言的tensorflow的‘端到端’的字符型验证码识别源码整理(github源码
复制链接

扫一扫