《模式识别(第三版)》
张学工 编著
清华大学出版社
第一章 概论
1.1模式与模式识别
1.2模式识别的主要问题
基于知识的方法
基于数据的方法
1.3监督模式识别与非监督模式识别
1.4模式识别系统举例
1.5模式识别系统的典型构成
处理监督模式识别问题的一般步骤
处理非监督模式识别问题的一般步骤
第二章 统计决策方法
2.1引言
朕觉得你们应该会。
真不会的话去看统计信号处理的复习提纲。
2.2最小错误率贝叶斯决策
无特殊说明下贝叶斯决策就是最小错误率贝叶斯决策。
2.3最小风险贝叶斯决策
2.4两类错误率
灵敏度 Sn : PD 真正阳性样本中被正确检测出来的比例。
特异性 Sp : 1−PF 阴性中没有被误判的比例。
第一类错误率 α=1−Sn ,假阳性,误报、虚惊。
第二类错误率 β=1−Sp ,假阴性,漏报。
2.5Neyman-Pearson决策
2.6ROC曲线
曲线下面积AUC可以定性的衡量性能。
2.7正态分布时的统计决策
多元正态分布 p(x)=1(2π)d/2|Σ|1/2exp(−12(x−μ)TΣ−1(x−μ))
多元正态分布完全由 μ 和 Σ 确定,可以记为 p(x)∼N(μ,Σ)
多元正态分布的等密度点轨迹为一超椭球面。,主轴方向由协方差矩阵的本征向量所决定,主轴的长度与协方差矩阵的本征值成正比。
2.8错误率的计算
2.9离散概率模型下的统计决策举例
第三章 概率密度函数的估计
3.1引言
贝叶斯决策的基础是概率密度函数的估计,即先验概率 P(ωi) 和类条件概率密度 p(x|ωi) ,重点是类条件概率密度的估计问题。
基于样本的两步贝叶斯决策:首先通过训练样本估计概率密度函数,再用统计决策进行类别判定。
概率密度函数的估计方法分为两大类:参数估计(parametric estimation)和非参数估计(nonparametric estimation)。
参数估计:已知概率密度函数的形式,但其中部分或全部参数未知,概率密度函数的估计问题退化成用样本来估计这些参数。
参数估计的方法:最大似然估计和贝叶斯估计,两种方法结果接近但处理方式不同。
非参数估计:概率密度函数的形式未知,用样本数值化的估计概率密度函数。
非参数估计的方法:直方图法、近邻法、Parzen窗法。
统计量:针对不同要求构造出的样本的某种函数。目的是将样本中的有关信息抽取出来。
参数空间:总体分布未知参数 θ 的全部可容许值组成的集合 Θ 。
点估计:构造统计量 d(x1,x2,......,xn) 作为参数 θ 的估计量 θ^ ,带入观测值求出的估计量的具体数值成为观测值。
区间估计:用区间 (d1,d2) 作为 θ 可能取值范围的一种估计,称为置信区间。
无偏性:参数 θ 的估计量 θ^ 的数学期望等于参数 θ 本身。样本数趋于无穷时才具有无偏性称为渐进无偏。
有效性:方差小的估计更有效。
一致性:任意给定正数 ϵ ,总有 limn→∞P(|θ^n−θ|>ϵ) 。一致性保证了样本无穷多时每一次估计的在概率上的性能。
3.2最大似然估计
最大似然估计的基本假设:
1)参数是确定但未知的量(多个参数时是向量)。
2)每类的样本满足独立同分布。
3)类条件概率密度 p(x|ωi) 具有某种确定的函数形式,只是参数未知。
4)各类样本只包含本类的分布信息,也就是说不同类别的参数是独立的,可以对每一类单独处理。
似然函数:
样本集包含N个样本,即 X=(x1,x2,.....,xn) ,样本是独立抽取的,所以出现样本集 X 的概率是出现各个样本的联合概率。
这个式子反映了不同参数下取得当前样本集的可能性,称为参数相对于样本集的似然函数,取N=1,得到的就是参数相对于每一个样本的似然函数。
在参数空间 Θ 中找到一个 θ 使得似然函数极大化。使得似然函数的值最大的 θ^=d(x1,x2,......,xn) 称作 θ 的最大似然估计量。
记作 θ^=arg max l(θ)
最大似然估计的求解: dl(θ)/dθ=0 ,方程可能有多个解,取使似然函数最大的那个。
正态分布下的最大似然估计:对均值和方差的估计。
3.3贝叶斯估计和贝叶斯学习
与最大似然估计的区别:最大似然估计将待估计的参数当做未知但固定的量,要根据观测数据估计这个量的值;贝叶斯估计把待估计的参数本身也看作随机变量,要根据观测对参数的分布进行估计。除了观测数据外,还可以考虑参数的先验分布。
贝叶斯学习:直接从数据对概率密度函数进行迭代估计。
贝叶斯估计的思路:写出以 θ^ 作为估计时的总期望风险 R ,定义样本
得到参数的后验概率后可以直接得到样本的概率密度函数 p(x