模式识别学习笔记

最新推荐文章于 2022-07-29 11:59:48 发布

智能摸鱼

最新推荐文章于 2022-07-29 11:59:48 发布

阅读量168

点赞数 2

文章标签：模式识别

本文链接：https://blog.csdn.net/weixin_42204960/article/details/88073529

版权

模式识别学习笔记

一些基本概念
- 数学概念
中心极限定理

一些基本概念

数学概念

类条件概率密度：已知目标的类别（事件发生）为 $\omega_k$ 的情况下，目标的某一特征（促成事件的条件，另一个事件） $x$ 的概率密度 $P(x|\omega_k)$ 。
先验概率：所有条件未知的情况下，事件发生的概率。

最小风险贝叶斯决策
例：假设观测到现象（事件） $x$ 后查出某细胞是肿瘤细胞（事件 $\omega_2$ ）的后验概率 $P(\omega_2|x)$ 为0.818，反之 $P(\omega_1|x)$ 为0.182。

决策\实际结果	$\omega_1$	$\omega_2$
$a_1$	$\lambda(a_1, \omega_1) = 0$	$\lambda(a_1, \omega_2) = 6$
$a_2$	$\lambda(a_2, \omega_1) = 1$	$\lambda(a_2, \omega_2) = 0$

设将结果判定为 $\omega_2$ 的决策表示为 $a_2$ ，反之为 $a_1$ ，则 $\omega_1$ 错判为 $a_2$ 的风险为 $1 * 0.818$ ， $\omega_2$ 错判为 $a_1$ 的风险为 $6 * 0.182$ ，按风险最小的原则，应当选择决策 $a_2$ 。

切比雪夫不等式
$P\{|X-\mu|\geq\varepsilon\}\leq \frac{\sigma^2}{\varepsilon^2}$
切比雪夫不等式给出了在随机变量的分布未知，只知道 $E (X)$ 和 $D (X)$ 的情况下的估计概率 $P\{|X-\mu|<\varepsilon\}$ 的界限。

中心极限定理

参数分布（parametric distribution）
少量可调节的参数控制了整个该概率分布

适定问题是指定解满足下面三个要求的问题：① 解是存在的；② 解是唯一的；③ 解连续依赖于定解条件，即解是稳定的。这三个要求中，只要有一个不满足，则称之为不适定问题。

线性回归问题中的正则化
如果参数对应一个较小的值，那么会得到形式更加简单的假设。惩罚高阶参数，使它们趋近于0，这样就会得到较为简单的假设，也就是得到简单的函数，这样就不易发生过拟合。但是在实际问题中，并不知道哪些是高阶多项式的项，所以在代价函数中增加一个惩罚项/正则化项，将代价函数中所有参数值。
对于方差形式的损失函数：
$\frac {1}{2} \sum _{n = 1}^{N} [y(x_n,w)-t]^2 + \frac {\lambda}{2} ||w_{(k)}||^2$
通过对其求导来求局部最小值，当 $\lambda$ 越大对 $w_{(k)}$ 的抑制作用就越大。