模式识别
1.模式识别的技术
包括两大类:分别是基于决策理论的统计模式识别和基于形式语言理论的句法模式识别。
句法模式识别与统计模式识别相比较,某些理论尚不成熟,但在动态景物分析和图像识别中很有用。
2.模式识别的常用术语
1.样本2.模式3.特征4.类型
样本:所研究对象的一个个体,比如医学诊断中的患者
模式:指需要识别且可测量的对象的描述。 如:人脸识别的模式——每幅人脸图像
特征:指用于表征样本的观测。
3.模式识别的过程
模式空间-特征空间-类型空间,需要进行降维操作。
模式空间-特征空间-类型空间
就是 世界空间,通过观、测量,信息提取,到达模式空间;再经过预处理,到达特征空间;再设计一个判断标准,实现分类。
3.1模式识别的三大任务
在进行二次特征提取时,在满足分类识别正确率的条件下,按照某种准则尽量选取对正确分类识别作用较大的特征,使得用较少的特征就能完成分类识别的任务。
在人工干预下,对三个方面分别进行改进(改进采集提取方法、改进特征提取与选择、制定改进分类识别规则)来提高准确率。
4.模式识别系统
模式识别系统的基本构成
建立分类器的过程叫做机器学习
4.1模式采集
传感器,测量装置,图象输入设备,A/D、D/A变换,滤波输入对象的信息
(1)一维波形:如语言、心电图、机械震动波。
(2)二维图形:如文字、指纹、照片、地图等。
(3)物理参量与逻辑值:如体温、各种实验数据等。
通过测量、采样和量化,可以用矩阵或向量表示二维图象或一维波形。<=信息获取过程
4.2预处理
目的:为了去除噪声,加强有用的信息,并对输入测量仪器或其他因素所造成的退化现象进行复原。
4.3 特征提取和选择
由于图像或波形所获取的数据很大,为了有效地实现分类识别,对原始数据变换,得到最能反映分类本质的特征。
特征选择:以某种判决规则为准则,且使分类错误最小,要考虑特征之间的统计关系<=正交变换
选择依据:选择对分类贡献大的特征,删除贡献甚微的特征
4.4 分类决策
定义:在特征空间中用统计方法把被识别对象归为某一类别。
方法:在样本训练集基础上确定某个判决规则,使按这种规则对被识别对象进行分类所造成的错误识别率最小,或引起的损失最小。
5.5 分类器
定义:实现对未知类别属性样本的分类判决
5.模式识别方法
包含统计模式识别和句法模式识别两大类。
1.统计模式识别是以试验样本在特征空间中的类概率密度函数为基础的。
2.句法模式识别是以图形结构特征为基础,运用形式语言理论的技术,适宜复杂景物图象分析和理解。
6.监督学习和非监督学习
监督模式识别:有一些数据样本,且他们都已有明确的类别标签,用他们来指导、设计分类标准。这种情况下建立分类器的问题属于监督学习问题,我们称为监督模式识别。
非监督模式识别:没有类别标签,更没有类别已知的样本用作训练,根据样本特征将样本聚成几个类,这种学习过程被称为非监督模式识别(统计中称为聚类,所得到的类别也称为聚类)。也可以理解监督学习和非监督学习为“有导师学习”和“无导师学习”。
这两者最大的区别在于训练样本
监督模式识别需要训练数据,根据训练样本设计分类器;
非监督模式识别则不需要训练数据,是根据样本的相似性来进行分类的。
仅用于模式识别的初学,后续还会继续更新这个模块!
参考原文链接:https://blog.csdn.net/qq_63647674/article/details/130528861