0 项目说明
手写数字识别系统的设计实现
提示:适合用于课程设计或毕业设计,工作量达标,源码开放
1 系统概述
字符识别是利用计算机自动辨识印刷在纸上或人写在纸上的汉字,是模式识别的一个重要分支,也是文字识别领域较为困难的问题之一。本项目旨在论述并设计实现一个自由手写体数字识别系统。
1.1 系统实现环境
Windows98/2000/XP是当前最流行的操作系统,现在大部分应用系统都是建立在这些平台上,同时考虑到软件系统的应用领域和可推广性,我们的系统也是基于Windows XP平台的。编程软件采用Matlab。
2 研究方法
文中首先对待识别数字的预处理进行了介绍,包括二值化、噪声处理、图像分割、归一化、细化等图像处理方法;其次,探讨了数字字符特征向量的提取;最后采用了bp神经网络算法,并以MATLAB作为编程工具实现了具有友好的图形用户界面的自由手写体数字识别系统。
2.1 图像预处理阶段
在获取原始数字图像过程中,由于光照、背景纹理、镜头分辨率、拍摄角度等原因,难免会造成图像失真并带有噪声。由于这些噪声的影响,如果对获取得到的数字图像进行直接处理的话通常不能得到满意的结果,因此在获取原始数字图像后,需要对图像进行预处理。对于字符识别的预处理过程一般包括:二值化、去噪声、数字分割、归一化处理、图像细化。经过预处理后的图片不仅能够有效滤除噪声,并且能够将不同的大小字符进行归一化到一个固定大小,对大量数据进行压缩处理。预处理阶段在该系统中是一个很重要的阶段。预处理效果的好坏会直接影响到整个系统的性能。
2.2 特征提取阶段
由于原始数字图像数据量大,冗余信息较多,一般不进行直接识别,而是进行提取有效特征数据、压缩数据,然后再进行识别。换句话说特征提取是为了去除图像信息中对分类没有帮助的部分,将图像信息集中到几个有代表性的特征上来的过程。
2.3 数字识别阶段
我们将提取到的特征值输入到已经训练好的神经网络中进行分类识别。
3 研究结论
在实验过程中我们分别对10个数字10个样本进行测试。从检测结果来看,虽然用于训练的数据集并不是很多,但误差率并不是很高,这也体现了BP算法的优越性,如果用更多的数据进行训练会使得正确的检测率提高而错误的检测率降低,从而使网络趋于收敛。实验结果表明,本方法具有较高的识别率,并具有较好的抗噪性能。
4 论文概览
5 最后
**项目分享: **
https://gitee.com/asoonis/htw