关于手写数字识别的一些调研

    手写数字识别,现在算是个比较成熟的应用,最初以为其是SDAE成功应用的一个领域,所以就仔细看了看,发现不是这么回事,现将最近看的整理如下:

    手写数字识别中识别方法现在流行的有3种:人工神经网络(ANN)、支持向量机(SVM)、隐马尔科夫模型(HMM)。使用人工神经神经网络时,将特征向量做为输入,利用的是整个网络的“自学习”和“记忆”的功能。【注】并不使用上述3种方法进行特征提取,仅仅是完成特征分类。

除了上述3种,还有基于统计结构特征的方法和基于结构特征的方法。这些方法都对应于具体的特征提取的方法,其特征的设计和提取都是针对手写数字的特有属性。

    常用的数字识别系统:原始图像采集>预处理>特征提取>分类识别>判别处理得结果

    预处理包括:滤波去噪、二值化、字符切分、图像校正、归一化处理。特征提取包括:笔画、拓扑点、投影形状等等,得到降维后的特征空间。 分类识别,一般有基于神经网络的方法和基于模板匹配的方法。考虑到神经网络更能容忍字符形变、噪声的特点,可将提取的特征作为已训练好的神经网络的输入进行分类识别。判别处理,一般是系统对于是被结果进行分析,如果不能接受则需进行下一步调整工作,以达到最好的识别结果。

    其中,用神经网络进行分类识别,只是用了简单的3层BP网络,网络设置:输入神经元个数与特征总维数等,输出神经元个数为10个神经元(因为要分成10个类别),中间隐层单元个数可以任意调整,有一条经验取值是:隐层神经元个数 约= sqrt(输入神经元个数+输出神经元个数)。

    以上资料多数内容参考:2012 南昌大学 胡迪雨 手写数字识别方法的应用及研究

    更新:最近在学习CRBM(分类的玻尔兹曼机)时发现,其可以直接对预处理后的手写数字完成特征提取和分类识别的两个过程(图1:隐层学习的数字图像的特征表示)。其中还涉及到直接对含噪音的数字图像通过神经网络的方式去噪,一改利用传统的中值滤波、高斯滤波等去噪的方法,实验效果还不错(图2:去噪结果)。

   

更多关于CRBM的内容请见文章“Classification using Discriminative Restricted Boltzmann Machines”.

对于CRBM就暂时这样一笔带过,后期做些实验后会有更详细的针对CRBM的分析。也请大神们,提供相应的好的学习资料,拜谢。

    

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值