浅谈模式识别中的特征提取

这两天一直在看深度学习的东西,看的头晕脑胀,不过晕乎归晕乎,感觉对模式识别中的特征提取有了更深一点的小理解,暂时记载下来。

突然觉得,模式识别的所有问题都绕不过两个关键门槛,第一是分类器,第二便是特征提取。而且几乎所有模式识别方面的研究都是在优化这两个问题,要么是造一个更牛的分类器,要么是找出一些表现力更高的特征形式。

然而这个问题再最近几年变得不那么明朗了,分类器的研究不用多说,从刚开始的K近邻分类器,贝叶斯分类器,到曾经风靡一时的SVM,再到目前处在浪潮之巅的DeepLearning(谷歌大脑主要就是用的这个,与其说是分类器,这应该更倾向于特征提取),分类器越来越复杂,性能越来越高。特征提取呢,大致也是如此。但存在这样一个问题,就是对经典的模式分类问题,比如指纹识别,文字识别等等,有规矩可循,特征提取自然举足轻重(角点,拐点之类的);但对于那些更抽象、更智能、更拟人的模式分类问题,比如美丽度识别、警觉度识别、表情识别等等,我们用什么特征来描述它们呢?特征提取充当什么样的角色?

其实对于没搞过模式识别或者是模式识别的初学者来说,这的确值得思考。做惯了传统的识别,再去研究美丽度、表情、警觉度这些抽象的东西,确实有点不适应。究其原因,就是找不到实实在在的东西去描述美丽度、表情、警觉度这些抽象的概念,提不到特征,分类识别自然也就无从谈起。

难道抽象形式的分类问题无从解决了吗?这个命题显然是错的,但提不到特征怎么解决呢?这就是问题的关键,不是提不到特征,只是提取不到客观的、可见的、可衡量的特征。按照稀疏表示人脸识别的先驱Ma Yi的观点:“图像本身是图像内容信息表示最冗余、也是最全面的存在”,也就是说,图像本身就是特征的存在。换句话说,感觉实在提取不到特征了,那就千拳归一路,把图像本身直接送给分类器去吧。

用分类器直接处理图像本身,看似鲁莽,其实蕴藏着真正至简的大道理。每种特征都有自身的局限性,都是有意突出图像某些方面的特征,简化甚至忽略别的方面的特征,导致的最终结果就是信息的丢失。Gabor特征搞人脸识别效果好,但它直接忽略了整体的亮度特征,那白人和黑人怎么办?所以只要能提去出具体的、客观实在的特征,就不可避免的存在着信息的丢失,那些丢失的次要信息,对于某些问题的影响可以忽略(如指纹识别、文字识别),但对有些主观问题的影响却是不可估量的。总之,这种机械的选择特征来替代原图像,是机器的思维方式,不是人的思维方式。

当今对于那些无法用具体特征描述的分类问题,存在两种主流的处理方式,要么干脆直接把图像送给分类器去,这是稀疏表示问题(Ma Yi在文章《Robust Face Recognition via Sparse Representation》中证实稀疏表示分类器的人脸识别性能对特征选择的依赖程度很小);要么然机器自己去学习该用那些特征,机器根据样本自己决定特征的取舍,这更是一种类人的智能化的做法,这也就衍生出了当今如火如荼的东西:深度学习(Deep Learning),名噪一时的谷歌大脑就是这样弄出来的。换句话说,如果不能判断解决一个识别问题应该用哪些特征,那就让机器自己去找好了。就好像支持向量机一样,既然人工找不到最优的分类超平面,就让机器自己去映射,自己去找。恰巧的是,人的大脑也是这么干的。

总之,在当今这个面向数据的年代,特征选择这个任务越来越不适合人工来做了,典型费力不讨好的工作,让机器自己去找,更符合人的思维。但特征提取是不存在了吗?不是的,因为Deep Learning就是在提特征,只不过让机器自己来做。

作者:u013088062 发表于2015/5/24 16:04:27 原文链接

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
全书,搞了很久才搞到。。。想传数字图像处理全书的,可惜我没有权限。要的朋友可以联系我 正如前面已经提到的那样,本书重点讨论统计模式识别方法特征提取和分类决策。 从教学角度出发,首先研究各种分类器的设计方法是qJ取的,在这个基础上就更容易理解特 征提取和选择的重要性。对于一个实际的模式识别系统,当然只有在特征确定以后,才能对 分类器的参数进行计算。实际工作,这两者常常是互相交又进行的,对不同的方案要进行 反复比较,特别是设计过程还可能影响到对训练集的重新编辑。本书的前几章着重讨论监 督学习,即已知训练集样本所属类别的条件下分类器的设计方法。然后讨论特征提取和选择 的准则和算法。在这之后,讨论在不利用或没有样本所属类别信息的情况下的分类方法,即 非监督模式识别方法。根据有关模式识别理论和技术的发展、我们在讨论了统计模式识别的 经典内容之后,分别在第ll章介绍“人工押经网络”,在第12章介绍“模糊模式识别方 法”及第13章介绍“统计学习理论和支持向量机”。最后在第14章巾简要介绍“模式U1别 在语音信号数字处理的应用举例”、第15章介绍“印刷体汉字识别小的特征提取”。希望 通过这些实例使读者对一些模式识别方法在一维信导和二维因像识别的应用钉一个更直 观的认识;同时也可了解到利用信号处理和图像处理技术获取模式识别特征的一些常用 方法。当然,由于篇幅和本书的目的所限,对这些例子的介绍只能是较简单的,仪供读者参 考,在学习模式识别课程时可以不讲、感兴趣者可以课后阅读。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值