模式识别
教材选择
模式识别与智能计算——MATLAB技术实现 ·杨淑莹 张 烨
模式识别 ·张学工
模式识别基本概念
1、模式是一种规律,代表具体时间和空间分布的信息,是样本所具有的特征描述。
2、模式类是模式所属的类别或同一类别中模式的总体
3、模式识别主要解决信息分类识别问题,是信息科学和人工智能的重要组成部分
4、样本是所研究对象的的一个个体
5、样本集是若干样本的集合
6、特征是表征样本的观察,通常是用数值表示的默写量化特征,有时叫属性,多个特征组成特征向量
模式识别的主要方法
基于知识的方法
以专家系统为代表,一般归在人工智能的范畴当中,其中心思想是根据人们已知(从专家哪里收集的资料)关于研究对象的知识,整理出若干描述特征与类别间关系的准则,建立一定的计算机推理系统,对未知样本通过这些知识推理决策其类别,特征与分类之间的关系存在规律性、完全确定的联系,使用知识方法更合适
句法模式识别是一种特殊的基于知识的模式识别方法,它的基本思想是将对象分解描述成一系列基本单元,每个基本单元表达成一个特定的符号,而构成对象的单元之间的关系描述成单元符号之间的句法关系,再利用形式语言,语法分析来实现对样本的分类
基于数据的方法
基于数据的模式识别的基础是统计模式识别,根据统计学原理建立分类器,特征与分类之间的关系既不是完全确定,也不是完全完全随机的情况使用此种方法更加合适
应用领域
识别、分类有关的所有领域,例如图像、文章、声音的识别等。
模式识别与机器学习的区别
模式识别是通过给机器各种特征描述,让机器对未知事物进行判断,机器学习是给机器海量样本,然那个机器自己发现特征,最后去判断未知事物。
模式识别典型过程
在要解决的模式识别问题中,已知要划分的类别,并且能够获得一定数量的类别已知的样本,这样情况下建立分类器的问题属于监督学习问题,称作监督模式识别。
在面对未知的对象时,通过考察这些对象之间的相似性将他们分开,通过这些对象具有的特征的规律将其最合理的分为机组,这种类别发现问题就是非监督学习,这种学习方式成为非监督模式识别,再统计学中通常被称为聚类。
前修基础课程
1、概率论与数理统计
2、线性代数(其中向量与矩阵很重要)
3、高等数学(微积分)
课后问题解答
1、简述特征空间优化的方法
一是特征选择,如果所选用的特征空间能使同类舞台分布具有紧致性,可为分类器设计成功提供良好的基础;反之,如何不同类别的样品在该特征空间中混杂在一起,再好的设计方法也无法提供分类器的准确性。二是特征的组合优化,通过一种映射变换改造元特征空间,构造一个新的精简的特征空间。
2、简述分类器的设计准则
(1)最小错分率准则
(2)最小风险准则
(3)近邻准则
(4)Fisher准则
(5)感知准则
(6)最小均方误差准则
以上设计准则将会在后续的文章中做详细推导
3、简述分类器设计的基本方法
借助计算节对信息进行处理、判决分类的数学统计方法,首先建立模式空间,接着在d维特征空间已经确定的前提下,选择合适的准则、方法将已经确定的d维特征空间划分为决策域。
4、简述在什么情况下分类器不可分
这种问题再书上有详细的讨论,其实总结来说就是在分类的样本获得的特征参数与分类器所需要的特征参数不相符合的时候分类器就不能很好的将样本分类,简单来说就是分类器设计时没有选择合适的准则和方法
5、分类器设计的基本方法
在样本训练集基础上确定判别函数、改进判别函数和误差校验
6、判别函数及判别函数需要确定的基本要素
判别函数d(X)是表达决策规则的函数,其需要确定的两个基本要素为选定所用的判别函数类型和确定方程的权向量W与阈值w