关于手写数字识别的一些调研

最新推荐文章于 2024-05-25 11:21:38 发布

Selina_Zeng

最新推荐文章于 2024-05-25 11:21:38 发布

阅读量5.5k

点赞数

分类专栏： DeepLearning 文章标签：简单BP CRBM

DeepLearning 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

手写数字识别，现在算是个比较成熟的应用，最初以为其是SDAE成功应用的一个领域，所以就仔细看了看，发现不是这么回事，现将最近看的整理如下：

手写数字识别中识别方法现在流行的有3种：人工神经网络（ANN）、支持向量机（SVM）、隐马尔科夫模型（HMM）。使用人工神经神经网络时，将特征向量做为输入，利用的是整个网络的“自学习”和“记忆”的功能。【注】并不使用上述3种方法进行特征提取，仅仅是完成特征分类。

除了上述3种，还有基于统计结构特征的方法和基于结构特征的方法。这些方法都对应于具体的特征提取的方法，其特征的设计和提取都是针对手写数字的特有属性。

常用的数字识别系统：原始图像采集>预处理>特征提取>分类识别>判别处理得结果

预处理包括：滤波去噪、二值化、字符切分、图像校正、归一化处理。特征提取包括：笔画、拓扑点、投影形状等等，得到降维后的特征空间。分类识别，一般有基于神经网络的方法和基于模板匹配的方法。考虑到神经网络更能容忍字符形变、噪声的特点，可将提取的特征作为已训练好的神经网络的输入进行分类识别。判别处理，一般是系统对于是被结果进行分析，如果不能接受则需进行下一步调整工作，以达到最好的识别结果。

其中，用神经网络进行分类识别，只是用了简单的3层BP网络，网络设置：输入神经元个数与特征总维数等，输出神经元个数为10个神经元（因为要分成10个类别），中间隐层单元个数可以任意调整，有一条经验取值是：隐层神经元个数约= sqrt(输入神经元个数+输出神经元个数)。

以上资料多数内容参考：2012 南昌大学胡迪雨手写数字识别方法的应用及研究

更新：最近在学习CRBM（分类的玻尔兹曼机）时发现，其可以直接对预处理后的手写数字完成特征提取和分类识别的两个过程（图1：隐层学习的数字图像的特征表示）。其中还涉及到直接对含噪音的数字图像通过神经网络的方式去噪，一改利用传统的中值滤波、高斯滤波等去噪的方法，实验效果还不错（图2：去噪结果）。