模式识别概论

目录

模式识别的定义

模式识别的主要方法

监督模式识别与非监督模式识别

一个简单的模式识别例子

模式识别的应用

模式识别与其他学科之间的联系与区别


模式识别的定义


1、使计算机模仿人的感知能力,从感知数据中提取信息(判别物体和行为)的过程;
2、对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程;
3、可以看做一种函数映射f(x),将待识别模式x从输入空间映射到输出空间;
4、根据已有的特征,通过参数或者非参数的方法给定模型中的参数,从而达到判别目的;

以上是从不同出处所知的不同定义,没有对错之分,选择一个自己觉得好记的就行

我们也可以对模式识别进行拆分理解:

模式:可看作是对象的组成成分或影响因素间存在的规律性关系,或者是因素间存在确定性或随机性规律的对象,过程或事件的集合。

识别:就是把对象分门别类地认出来。

模式识别:就是对模式的区分和认识,把对象根据其特征归到若干类别中适当的一类。

在学习模式识别算法前,我们需要学习一些前置知识

样本:所研究对象的一个个体。比如,医院里的众多患者,每个患者都是一个样本;
单一样本:医生诊断的某一患者,就是样本空间中的一个单一样本;
样本值:某一患者的化验、检查结果与表征现象。
样本集:若干样本的集合。按照一定原则把一部分患者当做一个集合。
已知样本:指事先知道类别标号的样本。医生看过的病人,相关病情信息已经掌握好了。
未知样本:指类别标号未知但特征已知的样本。新来的病患的情况,还需要医生用专业知识来诊断其类别。

类或类别:在所有样本上定义的一个子集,处于同一类的样本在我们所关心的某种性质上是不可区分的,即具有相同的模式。比如,疾病分为不同类别,消化系统疾病、泌尿系统疾病等等。

特征:指用于表征样本的观测,通常是数值表示的某些量化特征,有时也被称作属性。患者某些具有显著特点的化验数据及表征,如血压值。特征的度量可以定量(具体数值)也可以定性(重、轻...)

所谓模式识别的问题,就是用计算的方法根据样本的特征将样本划分到一定的类别中去。
 

模式识别的主要方法

基于知识的方法

主要指以专家系统为代表的方法。基本思想是,根据人们已知的(从专家那里收集整理的)关于研究对象的知识,整理出若干描述特征与类别间关系的准则,建立一定的计算机推理系统,对未知样本通过这些知识推理决策其类别。
句法模式识别也可以看作是一种特殊的基于知识的模式识别方法。它的基本思想是,把对象分解描述成一系列基本单元,每一个基本单元表达成一定的符号,而构成对象的单元之间的关系描述成单元符号之间句法关系,利用形式语言、句法分析的原理来实现对样本的分类。 

基于数据的方法

在确定了描述样本所采用的特征后,这些方法并不是依靠人们对所研究的对象的认识来建立分类系统,而是收集一定数量的已知样本,用这些作为训练集(training set)来训练一定的模式识别机器,使之在训练后能够对未知样本进行分类。

G表示对象的特征选择的过程,x是特征向量,S是表示x与y关系的机制,存在但不知道内部机理。我们用一定数量的样本(x,y)来训练模型LM,建立x到y'的关系,y'=f(x),f(x)称为分类器。

监督模式识别与非监督模式识别

一个简单的模式识别例子

问题:将鲈鱼Sea bass和鲑鱼Salmon进行分类,识别率达95%以上

模式识别的步骤:

1、信息获取:当一条新鱼进入分拣区域时(在皮带上),摄像机捕捉到图像。

2、预处理:

摄像机的调整:能将传送带上的鱼拍清楚,需要调整相机的拍照频率和传送带速度相平衡。
消除噪音和遮挡:可以手动去除鱼身上的海草再放上传送带;用去噪算法消除噪音是王道。
背景去除与分割:把图像中的鱼与背景分离,将鱼与鱼分离。

3、特征提取与选择

选择明显可以区分的特征组合(一个或多个),确定一个最小化分类错误的决策边界(阈值)

4、分类器设计(训练)与分类决策(识别)

选择一个合适的模型进行训练,比如线性分类模型等,考虑欠拟合和过拟合的问题。

需要注意的是:鲑鱼的市场价格高于鲈鱼,当前分类结果不是100%有效,为了不让买鱼客户吃亏,应该尽可能让出错的情况是鲑鱼分到鲈鱼那一堆中。

模式识别的应用

语音识别:

1、语音通过信号采集系统进入计算机,成为数字化的时间序列信号;

2、按帧处理,对孤立的音素进行识别。

3、每一帧语音经过一定的信号处理后被提取成一个特征向量。每一个音素是一类,音素识别就是把样本分到多类中的一类。对语音样本的识别是由分类器来实现的。

4、但要考虑到语音的连续性,用一个隐马尔可夫模型把相邻的因素联合起来考虑。在对音素识别的基础上还要对一定的语言模型进行后处理。

说话人识别、字符与文字识别、复杂图像中特定目标的识别、根据地震勘探数据对地下储层性质的识别、利用基因表达数据进行癌症分类等。

模式识别与其他学科之间的联系与区别

人工智能:给机器赋予人类的智能,让机器能够像人类那样独立思考。
机器学习:给定目标通过一定的数据来训练机器,让机器能学习到知识,来指导进一步的判断。
数据挖掘:交叉性强的学科,用机器学习算法及传统统计方法,从数据中挖掘到为我所用的知识,指导人们的活动。
计算机视觉:用计算机来模拟人的视觉机理获取和处理信息的能力。
模式识别对模式的区分和认识,把对象根据其特征归到若干类别中活当的一类。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值