模式和模式识别
| 模式和模式识别概述 |
1.模式、模式类与集合 所谓模式是指在规定的特性上有相似之处的一些具体事物或现象。模式是人认识具体事物或现象时,按照规定的相似性抽象出来的分类,即模式,如图1所示。人们从6张样件图案的观察中找到每张图中图形“虚与实”的相似性,把它们分成“上实下虚”和“上虚下实,,两类,即两个模式。有了这种抽象后,可以对以后遇到的类似图案进行识别。 所谓模式识别是指按模式抽象对事物或现象进行分类,辨识类的特征而做出判断的过程。模式识别是研究人类识别能力的数学模型,并借助于计算机技术实现对其模拟的科学,其识别系统如图2所示。 |
|
|

|
|
|
|
|
例如:黑白图像的灰度值有m=1,n=2;而彩色电视机的彩色图像则有m=3,n=3,其模式为fr(x,y,t)、fg(x,y,t)与fb(x,y,t)。 (4)模式识别 用数学方法和计算机技术研究模式的自动处理和识别判断。 (5)模式类 简称类,是指模式识别时所分的类。在模式分类中,每个模式作为一个整体而不依赖于其他模式,把它分到k个可能类别Ωk(k=1,2,…,k)中某一个类Ωk,且仅能被分到这一个类Ωk中,如切削过程工况常被分为“正常”与“异常”两类。 模式识别通常应满足条件:
|
|
|

|
|
模式类把Ω分成个数等于类数的几个子集(空间),每个模式类是其中的一个元素。 2.模式识别中分类的基本原则 1)应有一个代表性的样本集ω(ω Ω),供搜集有关问题范围Ω的信息; 2)一个模式应具备一个类的属性特征: 3)同类模式的类属性特征在特征空间中组成某种排序的聚合域,不同类别的特征组成的区域是分离的; 4)一个复杂的模式应能分解为简单的组成部分,即模式元; 5)模式元间有一种确定的关系; 6)如果两个模式的特征或模式元间,在规定的阈值下测得的差别是微小而可以忽略,则它们是相似的。 3.模式识别系统工作的可靠性及其度量 模式识别系统工作的可靠性是指它具有的识别指标(品质)的概率,常用误识(概)率表征其识别系统工作的品质度量。误识率是在样本发生的概率下误识别的概率,是一个条件概率。模式识别系统的TRTT要求先设计样本,以此求出决策规划,使该系统在规定的误识率(可靠性)下,有不低于给定的识别品质指标。为了评价该系统需要平价识别系统的样本,但两类样本都是对待识别对象在规定要求下的观测值。因此,统计决策理论是处理模式识别中模式分类与识别系统设计的基础。 |
| 贝叶斯决策 |
运用统计决策理论设计的分类系统又称为分类器。贝叶斯决策是一种统计模式识别决策法,它有如下基本假定: l)各类别总体的概率分布是已知的; 2)被决策的分类数是一定的; 3)被识别的事物或对象有d个特征观测值x1,x2…xd,它们的所有可能取值构成d维空间,称x=[x1,x2,…,xd]T为d维特征向量,T表示转置。 1. 基于最小错误率的贝叶斯决策规则 |
|
| 若 |

|
| 则 |
|
|
换言之,要求最小错误率,就是要求p(ωi|x)为最大,式(38)又可表达为 |
|
| 若 |

|
|
|
其物理意义为:在观测得到的d维特征向量x发生的条件下,类别ωi的所有条件概率中最大者为应归属的类,这样做可以使识别决策的错误率为最小、,即实现最小错误率的识别决策。 按贝叶斯公式有 |
|
|

|
|
式中 c——类别数,Ω=Ωi(ω1,ω2,…,ωi) x——·所有可能取值范围构成的d维空间中的d维特征向量
x=[x1,x2,…,xd]T (41)
p(ωi)、p(ωj)——先验概率; ——表示对于一切,如 j表示对一切的j。 2.基于最小风险的贝叶斯决策规则 基于最小错误率的贝叶斯决策只能保证错误率达到最小,而不能确定决策带来的后果,即风险性。若定义λ为决策αi和自然状态(类别)ωj的函数,以它表征决策为αi时损失,而
λ(αi,ωj)(i=1,2,…,α;j=1,2,…,c) (42)
定义给定观测值x下的条件期望损失(或条件风险)为 |
|
|

|
|
则R(αi|x)表示对于某个x取值采取决策αi所带来的风险。基于最小风险的贝叶斯决策规则为
若 R(αk|x)=minR(αi|x),则α=αk (44) 式中 k∈α。 式(43)含义为:对于所有x取值的条件风险R(αi|x),最小风险(损失)的决策是使R(αi|x)取得最小值时的决策。 3.两类错误可能性 在上述决策规则下有犯两类错误的可能,当事实上的状态为ω2(若只讨论c=2的两类问题时),但决策为ω1,亦或反之。这两类错误的概率为 |
|
|

|
|
称p1(e)与p2(e)分别为两类错误率。事实上,基于最小错误率的贝叶斯决策是使这两类错误率之和为最小,即
min[p(ω2)p2(e)+p(ω1)p1(e)] (46)
对于基于最小错误和最小风险的贝叶斯决策均要求先给定x与p(ωi),且p(ωi)不可变。当p(ωi)可变或事前无法知道时,利用上述两种决策规则就无法达到最小错误率或最小风险的水平。 |
发表于 @ 2006年03月10日 14:14:00|评论(loading...)