模式识别——0.绪论

最新推荐文章于 2022-10-21 10:21:41 发布

Druid_C

最新推荐文章于 2022-10-21 10:21:41 发布

阅读量507

点赞数

分类专栏：模式识别文章标签：模式识别

本文链接：https://blog.csdn.net/Druid_C/article/details/103434683

版权

模式识别专栏收录该内容

3 篇文章 1 订阅

订阅专栏

第一章绪论

主要是针对考试的复习，和一些重点内容的标注，对书本内容做了删减，加了自己的笔记和思考
注：该系列参考的是机械工业出版社的模式分类和周志华老师的西瓜书。按理说应该投转载，但苦于不知道该怎么写原文链接所以作罢，但在这里还是要说明一下类型为【转载】，后续章节亦然，不再重复说明。

0.1模式识别系统

传感器
如摄像机和麦克风阵列、温度传感器和其他诸如气象监测仪器或通量仪等可供输入的数据、图像、文本、语音信号等，可能需要考虑带宽、分辨率、灵敏度、失真、信噪比、延迟等。
分割和组织
例如图像中的物体与背景分割、语音识别中的发音音素分割。面临的问题是如何识别或组织一个复合物体的不同部分（类似于划分和拼接的问题）。
特征提取
一个好的鱼类分类器在指纹识别或细胞识别毫无作用，一般情况下，需要针对研究对象进行专门的特征提取器，所以更加依赖于具体问题和具体领域。
分类器
系统中分类器的作用是根据特征提取器得到的特征向量来给一个被测对象赋一个类别标记。分类的难易程度取决于1.来自同一个类别的不同个体之间的特征值的波动（波动可能来自问题的复杂度和噪声）；2.属于不同类别的样本的特征值之间的差异。
噪声：如果一个感知到的模式属性并非来自真正模式的模型，而是来自环境中的某种随机性或者是传感器性能的缺陷，那么就是噪声。
后处理
从概念上讲，最简单的分类器性能度量是分类误差率，即新模式被标记为错误类别的百分比。因此一般的做法是寻求具有最低分类误差率的分类器，而更好的做法是推荐一个能够降低总体代价（风险）的动作。

0.2设计循环

设计一个模式识别系统通常涉及如下几个不同步骤的重复：数据采集，模型选择，训练，评价，计算复杂度。
这些步骤都面临常见的问题，例如数据采集，怎么才能知道已经采集到足够多有代表性的数据呢？特征选择中我们希望发现容易提取、对不相关变形保持不敏感、对噪声不敏感以及对区分不i同类别的模式很有效的特征集。对于模型选择，我们怎样知道应该拒绝一类模型而选用另一个呢？怎么能对模型得到预期性的改善？训练，利用样本数据来确定分类器的过程为训练分类器。过去25年的试验和经验表面“基于样本的学习”是最有效的方法，这一方法具体是什么？评价，在鱼类分类案例中，从单一特征到两个特征所依据的理由是，单一特征的分类误差率的评价不够好。过于复杂的系统对训练样本集能获得完美的表现，但会出现过拟合的现象。那么是否存在原则性的方法能确定一个分类器具有最佳的复杂度？计算复杂度在计算简便性和分类性能上存在什么样的折中？所采用的特征维数、模式的数目和类别数是什么函数？

0.3学习算法

有监督学习
在有监督学习中存在一个教师信号，对训练集样本中的每个输入样本能提供类别标记和分类代价（相当于有一个决策者给每个样本打上tag），并寻找能降低总体代价的方向（比如梯度下降）。
无监督学习
在无监督学习中没有教师信号。系统对输入的样本自动形成聚类或自然的组织。聚类的规则是由聚类系统所采用的显式或隐式的准则确定的。
强化学习
不需要指明目标类别的教师信号，只需要对这次分类任务完成情况给出对或错的反馈。即，给定一个输入样本，计算其输出类别，把它与已知的类别做比较，根据差异来改善分类器的性能。