统计模式识别学习笔记

本系列博客作为《统计模式识别》(Andrew R. Webb所著)一书的学习笔记。作者本人在做视觉SLAM时,偶有所想,遂动笔记录了统计模式识别的学习过程。在此之前,做过一段时间的深度学习和目标检测,希望能和诸位同好者,共同学习、共同进步。

一、绪论

统计模式识别一词概括了问题描述、数据采集、识别分类、结果评价、解释的各个阶段。

统计模式识别实际上是研究数据的一类科学,和计算机科学联系紧密。信息时代,每天都会诞生大量的数据,在这里我想借用师兄一句话。

我曾经问过师兄,深度学习是什么?

或者说这类研究数据的科学做的是什么,意义何在?

他是这样回答的, 深度学习,深度挖掘潜藏在数据中的内涵。 那换成这本书中的语言,是这样的:

通过对数据中所蕴含的模式、变化趋势、异常现象的自动识别及识别结构的描述,协助人们认知它们。

分析的方法和研究对象有着密切的联系。 但是,世界千奇百怪,在我们认知世界的过程中习惯将事物分类,(注意我在这里讲到了认知这个概念,或许在以后我在进行深度学习的讲解时会对这个词汇进行补充),这是我们学习的一种方式。而在我们遇到新事物的时候,常常会思考,这类事物和我以往认知到的是否有相同之处。简而言之,我们习惯将事物分类。

所以,也正如作者所说,这本书的主题可以简单归纳为分类这个词,包括有监督分类无监督分类。当我看到这两个词的时候,第一反应是有监督学习无监督学习,事实上在这本书的论题中两者的差别也并不是很大。

有监督分类是有分类信息的分类(判别)器设计,用机器学习中话来讲就是有标签label。无监督学习是没有分类信息的分组(聚类),也就是没有label。

接下来谈谈它的发展,作为一个研究领域,模式识别迅速发展于20世纪60年代。它是一个多领域交叉的学科,包括字符的自动识别、医疗诊断等经典问题,以及个人信用评分、商品销售分析、信用卡交易分析等关于数据挖掘的新问题。模式识别广泛的应用,吸引了众多的研究力量,产生出许多新方法,推动该科学进一步发展。

正如前面讲到的,在认知世界的过程中,我们习惯将事物分类。所以,作为同样认知世界的一种手段,它也激发了一些人对人工智能的研究兴趣。作者本人当初接触模式识别,是因为偶然间发现自己做的图像识别同自然语言处理、神经网络等都和模式识别都有联系,故而产生好奇心,在半年前买了这本书。

书中谈到了这样一个观点,机器学习和统计模式识别有哪些不同。书中是这样描述的,机器学习是研究如何使机器适应环境和通过范例进行学习的一门学科。 在这本书里的论题可以归于机器学习的范畴。尽管机器学习更多地把重点放在计算的精深方法而不是统计方法上两者还是有着许多共同点的。这里,我还是想说一点自己的想法。

在周志华的西瓜书中说到,时下机器学习的热潮是统计机器学习。 当然感兴趣的朋友也可以买一下周志华的《机器学习》和李航的《统计学习方法》,这两本都是比较经典的人工智能书籍了。也正如大家熟知的,自下而上的机器学习,等同于白痴。刚才说了一句题外话,所以我认为机器学习的研究方向还是极有可能强调统计方法的,毕竟人家能用了就是因为概率和数理统计。

  1. 数学模型

    统计模式识别,首先来看一下模式。模式被表示为p维的数据向量:
    x ⃗ = ( x 1 , . . . , x p ) T % \vec{x}=(x_1,...,x_p)^T x =(x1,...,xp)T
    T % \ ^T T表示向量的转置,向量分量 x i % \f is defined as f(#1) using the macro x_i xi表示对观测对象的第i个特征的观测值。设识别问题含有C个类,记为 ϖ 1 , . . . , ϖ C % \varpi_1,...,\varpi_C ϖ1,...,ϖC,则关于每一个模式 x ⃗ % \f is defined as f(#1) using the macro \vec{x} x 的分类变量记为 z z z z z z 表示 x ⃗ % \f is defined as f(#1) using the macro \vec{x} x 的类别,若 z z z = i i i,则模式 x ⃗ % \f is defined as f(#1) using the macro \vec{x} x 属于 ϖ i \varpi_i ϖi类, i ∈ { 1 , . . . , C } i\in\{1,...,C\} i{1,...,C}

  2. 分类器

    所以,上述过程本质上是先提取特征,然后进行分类。 z z z实际上就相当于label。所以,这本书的内容也是围绕着“分类器设计”和“分类器设计规则”这一主题展开的。关于特征的选取,不同的研究对象有着不同的方法。

    分类器也包括了决策树、神经网络、支持向量机和线性判别函数。

分类器的设计就是用训练集确定分类器的内部参数,由此形成的分类器可用于估计未知样本 x ⃗ \vec{x} x 的类别属性。从训练集中学习模型的过程是归纳过程,而用训练集而得的模型去识别未知模型的过程则是演绎过程。

文章写到这里,已经是深夜了。在学习深度学习和视觉SLAM的过程中,我通过CSDN,解决了很多问题,在此我非常感谢乐于分享知识的各位站友。你们是我的动力来源。此外,我还要感谢师兄马泽远。是他,指引了我的大学生活。还有,我要感谢一个小学妹,是她第一个关注了我,至少我写的文章有人看了。最后,我要感谢实验室项目组的老师、师兄师姐还有朋友们。

闲言少叙,路过的朋友可以点一下关注。今后还会继续更新这个系列,欢迎各位进行学术交流与指导。你们就是我写文的动力,希望能和各位读者一起共同进步、共同成长。

全书,搞了很久才搞到。。。想传数字图像处理全书的,可惜我没有权限。要的朋友可以联系我 正如前面已经提到的那样,本书重点讨论统计模式识别方法中的特征提取和分类决策。 从教学角度出发,首先研究各种分类器的设计方法是qJ取的,在这个基础上就更容易理解特 征提取和选择的重要性。对于一个实际的模式识别系统,当然只有在特征确定以后,才能对 分类器的参数进行计算。实际工作中,这两者常常是互相交又进行的,对不同的方案要进行 反复比较,特别是设计过程还可能影响到对训练集的重新编辑。本书的前几章着重讨论监 督学习,即已知训练集样本所属类别的条件下分类器的设计方法。然后讨论特征提取和选择 的准则和算法。在这之后,讨论在不利用或没有样本所属类别信息的情况下的分类方法,即 非监督模式识别方法。根据有关模式识别理论和技术的发展、我们在讨论了统计模式识别的 经典内容之后,分别在第ll章中介绍“人工押经网络”,在第12章中介绍“模糊模式识别方 法”及第13章中介绍“统计学习理论和支持向量机”。最后在第14章巾简要介绍“模式U1别 在语音信号数字处理中的应用举例”、第15章中介绍“印刷体汉字识别小的特征提取”。希望 通过这些实例使读者对一些模式识别方法在一维信导和二维因像识别中的应用钉一个更直 观的认识;同时也可了解到利用信号处理和图像处理技术获取模式识别的特征的一些常用 方法。当然,由于篇幅和本书的目的所限,对这些例子的介绍只能是较简单的,仪供读者参 考,在学习模式识别课程时可以不讲、感兴趣者可以课后阅读。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值