模式识别入门与贝叶斯决策理论

最新推荐文章于 2023-02-28 20:34:42 发布

zl87758539

最新推荐文章于 2023-02-28 20:34:42 发布

阅读量1.4k

点赞数 1

分类专栏：模式识别一贝叶斯文章标签： pattern 模式

模式识别一贝叶斯专栏收录该内容

2 篇文章 0 订阅

订阅专栏

关键词：监督模式和非监督，马氏距离，bayes决策理论

1.监督模式识别和非监督模式识别的区别
监督学习(supervised pattern recognition)：已知要划分的类别，并且能够获得一定数量的类别已知的训练样本。
非监督学习（unsupervised pattern recognition）：事先不知道划分的是什么类别，更没有类别已知的样本做训练。
说白了就是给你数据和label就是监督的，没有label只有数据就是非监督的。

2.一般的模式识别问题分为4部分：原始数据的获取和预处理，特征提取和选择、分类或者聚类、后处理。
处理监督模式识别问题的一般步骤：
- 分析问题
- 原始特征获取
- 特征提取和选择
- 分类器的设计（训练）
- 分类决策（识别）

非监督问题：
- 分析问题
- 原始特征获取
- 特征提取和选择
- 聚类分析
- 结果揭示

bayes决策理论

最小错误率贝叶斯决策：

从最小错误了处罚，利用概率论中的贝叶斯公式，就能的初始错误率最小的分类决策。

min P (e) = \int P (e | x) p (x) d x

$\min P(e)=\int P(e|x)p(x)dx$
有多种等价形式如：

P (ω i | x) = max j = 1, 2 P (ω j | x)

$P(\omega_i|x)=\max_{j=1,2}P(\omega_j|x)$
或者：

l (x) = p ( x | ω 1 ) p ( x | ω 2 ) > λ = P ( ω 1 ) P ( ω 2 ), 则 x \in {ω 1 ω 2

$l(x)=\frac{p(x|\omega_1)}{p(x|\omega_2)}>\lambda =\frac{P{(\omega_1)}}{P(\omega_2)},则x\in \left \{ \begin{aligned} \omega_1\\ \omega_2 \end{aligned} \right.$
一般：

P (e) = P (ω 2) P 2 (e) + P (ω 1) P 1 (e)

$P(e)=P(\omega_2)P_2(e)+P(\omega_1)P_1(e)$

最小贝叶斯风险决策：

考虑各种错误造成损失不同时的一种最优策略。
（1）把样本x看做d为随即向量 $x=[x_1,x_2,...,x_d]^T$
（2）状态空间 $\Omega$ 由c个可能的状态（即有c类）组成： $\Omega={\omega_1,\omega_2,...,\omega_c}$
（3）对随即向量x可能采取的决策组成了决策空间，它由k个决策组成
${\alpha_1,\alpha_2,...,\alpha_k}$
（4）对于实际状态为 $\omega_j的向量x，才去决策\alpha_i所带来的损失为$
$\lambda(\alpha_i,\omega_j),\quad i=1,...k,\quad j=1,...,c$
每个决策的的期望损失为： $R(\alpha_i|x)=E[\lambda(\alpha_i,\omega_j)|x]=\sum_{j=1}^c\lambda(\alpha_i,\omega_j)P(\omega_j|x),i=1,...,k$
在的的特征空间中所有可能的样板恩x才去决策所造成的期望损失是：

R (α) = \int R (α (x) | x) d x

$R(\alpha)=\int R(\alpha(x)|x)dx$
最小风险贝叶斯决策就是最小化这一期望风险:

min α R (α)

$\min_{\alpha}R(\alpha)$

Neyman Pearson决策规则

限定一类错误率为常数，而使另一类错误率最小的决策规则称作NeymanPearson准则

朴素贝叶斯分类器（Naive Bayes）

p (x 1, x 2, . . ., x d | w) = p (x 1 | w) p (x 2 | w) . . . p (x d | w)

$p(x_1,x_2,...,x_d|w)=p(x_1|w)p(x_2|w)...p(x_d|w)$

马氏距离

d (x) = (x - μ) T Σ - 1 (x - μ)

$d(x)=(x-\mu)^T\Sigma^{-1}(x-\mu)$
优点：它不受量纲的影响，两点之间的马氏距离与原始数据的测量单位无关；由标准化数据和中心化数据(即原始数据与均值之差）计算出的二点之间的马氏距离相同。马氏距离还可以排除变量之间的相关性的干扰。缺点：它的缺点是夸大了变化微小的变量的作用。