绪论
一、模式识别的概念
- 研究如何使机器具有识别、分类能力的学科;
- 利用计算机自动地把待识别的模式分配到各自的模式类中。
二、模式识别实例
实例:以癌细胞识别为例,介绍机器识别全过程。
1.信息输入与数据获取
将显微细胞图像转换成数字化细胞图像,其中灰度数字图像的像素值反映光密度的大小。
2.预处理与区域划分
(1)预处理的目的:
①去除在数据获取时引入的噪声与干扰;
②去除所有夹杂在背景的次要图像,突出主要的待识别图像。
(2)区域划分的目的:
找出区分边界,划分出三个区域,为特征抽取做准备。
3.细胞特征的抽取、选择和提取
目的:为了建立各种特征的数学模型,用于分类。
(1)特征抽取:在原始采集数据上进行特征抽取。
eg:对一个细胞抽取33个特征,建立一个33维的空间,每个细胞可以通过一个33维随机向量表示。
(2)特征选择:在原始特征基础上选择一些主要特征作为判别使用;
(3)特征提取:采用某种变换技术,进行特征维数压缩。
4.判别分类
判别结果通过错误率评估。
三、模式识别系统
1.组成
2.组成单元
(1)数据获取:用计算机可以运算的符号来表示所研究的对象。
(2)预处理:去除噪声,提取有用信息,并对输入测量仪器或其他因素所造成的退化现象进行复原。
(3)特征提取和选择:对原始数据进行变换,得到最能反映分类本质的特征。
测量空间:原始数据组成的空间
特征空间:分类识别赖以进行的空间
模式表示:维数较高的测量空间 -> 维数较低的特征空间
(4)分类决策:在特征空间中用模式识别的方法把被识别对象归为某一类。
四、模式识别分类
1.统计模式识别
采用概率论和数理统计的方法,通过判别函数,使得误判概率最小。
2.句法模式识别
对模式结构进行分析,将模式表示为基元,基元之间满足一定的语法结构。
3.模糊模式识别
以隶属度μ为基础,运用模糊数学中的“关系”概念和运算进行分类。
隶属度反映了某一元素属于某集合的程度。
4.神经网络模式识别
以人工神经元为基础,模拟人脑神经细胞的工作特点,实现形象思维的模拟。
5.先验知识模式识别
(1)监督分类:在有足够先验知识的前提下,利用判别函数进行分类判别。
(2)非监督分类:在没有先验知识的情况下,采用聚类分析的方法。
五、模式识别数学基础
1.计算矩阵的特征值和特征向量
2.计算矩阵的行列式
3. 计算矩阵的逆矩阵
4.自相关矩阵Rx
自相关矩阵定义为随机向量与自身的外积的数学期望: