Chp2. 统计决策方法
2.1 基本概念(引例)
- 分类可以看作一种决策,即我们根据观测样本做出归属哪类的决策。
- def先验概率(Priori Probability): 没有对样本进行观测的情况下的概率。
Eg. 猜测手中的硬币是哪一面,判断 P ( ω 1 ) = P ( ω 2 ) = 0.5 P(\omega_1)=P(\omega_2)=0.5 P(ω1)=P(ω2)=0.5利用的是先验概率。 - def错误率: 对所有可能出现样本上类别决策错误的概率。
- def后验概率: 在有特征的前提下的概率
P
(
ω
1
∣
x
)
P(\omega_1|x)
P(ω1∣x)。
Eg. 根据硬币的重量 x x x判别硬币的类型。 - 贝叶斯公式(Bayes’ Formula)(很重要)
后验概率为:
P ( ω i ∣ x ) = p ( x , ω i ) p ( x ) = p ( x ∣ ω i ) P ( ω i ) p ( x , ω i ) P(\omega_i|x)=\frac{p(x,\omega_i)}{p(x)}=\frac{p(x|\omega_i)P(\omega_i)}{p(x,\omega_i)} P(ωi∣x)=p(x)p(x,ωi)=p(x,ωi)p(x∣ωi)P(ωi)
where, P ( ω i ) P(\omega_i) P(ωi)是先验概率, p ( x ∣ ω i ) p(x|\omega_i) p(x∣ωi)为类条件概率密度 - 贝叶斯决策(Bayes Descion)
在已知先验概率(或可以估计)和类条件概率密度的情况下,通过贝叶斯公式比较后验概率,决策为后验概率大的一类,使得总体错误率最小(最小错误率原则)。 - 约定表述:
假定样本 x ∈ R d x\in R^d x∈Rd是由 d d d维(Dimension)实数特征组成的,即
x = [ x 1 , x 2 , . . . , x d ] T x=[x_1, x_2, ... , x_d]^T x=[x1,x2,...,xd]T
要研究的类别有c个(Class),记为 ω i , i = 1.. c \omega_i,\ i=1..c ωi, i=1..c
类别数 c c c已知,类条件概率密度已知,要对未知样本 x x x做决策 - 对二分类问题
错分类的概率为
p ( e ∣ x ) = { P ( ω 2 ∣ x ) , x ∈ ω 1 P ( ω 1 ∣ x ) , x ∈ ω 2 p(e|x)=\left\{ \begin{matrix} P(\omega_2|x),\ x\in \omega_1 \\ P(\omega_1|x), \ x\in \omega_2 \end{matrix} \right. p(e∣x)={P(ω2∣x), x∈ω1P(ω1∣x), x∈ω2
错误率为所有独立同分布样本上的错误概率的期望
P ( e ) = ∫ p ( e ∣ x ) p ( x ) d x P(e)=\int p(e|x)p(x)dx P(e)=∫p(e∣x)p(x)dx
Ps. 已知 x x x的分布,
E ( f ( x ) ) = ∫ f ( x ) p ( x ) d x E(f(x))=\int f(x)p(x)dx E(f(x))=∫f(x)p(x)dx
2.2 最小错误率贝叶斯决策
- 最小错误率决策规则
m i n P ( e ) = ∫ p ( e ∣ x ) p ( x ) d x min\ P(e)=\int p(e|x)p(x)dx min P(e)=∫p(e∣x)p(x)dx