基本概念
- 概率密度函数:用于直观描述连续性随机变量,表示瞬时幅值落在某指定范围内的概率。落在各个点的可能性,落在每一个点处的相对大小。
在坐标轴上,概率密度函数的y值表示落在x点上的概率为y - 分布函数:用于描述随机变量落在任一区间上的概率
在坐标轴上,分布函数的函数值y表示x落在区间(负无穷,正无穷)上的概率
分布函数是概率密度函数从负无穷到正无穷上的积分
- 先验概率 P ( w i ) P(w_i) P(wi):没有对样本进行任何观测情况下的概率,也就是未获得观测数据之前类别的分布
- 类条件概率 P ( x ∣ w i ) P(x|w_i) P(x∣wi):表示在 w i w_i wi类条件下x的概率密度函数。
也就是它的分布取决于类别状态 - 后验概率 P ( w i ∣ x ) P(w_i|x) P(wi∣x):在x情况下属于 w i w_i wi类的概率
如:已知硬币重量为x的情况下硬币属于 w i w_i wi类的概率 - 贝叶斯公式: P ( w i ∣ x ) = p ( x , w i ) p ( x ) = p ( x ∣ w i ) p ( w i ) p ( x ) = p ( x ∣ w i ) p ( w i ) ∑ j = 1 n p ( x ∣ w j ) p ( w j ) P(w_i|x)=\frac{p(x,w_i)}{p(x)}=\frac{p(x|w_i)p(w_i)}{p(x)}=\frac{p(x|w_i)p(w_i)}{\sum_{j=1}^{n}p(x|w_j)p(w_j)} P(wi∣x)=p(x)p(x,wi)=p(x)p(x∣wi)p(wi)=∑j=1np(x∣wj)p(wj)p(x∣wi)p(wi) n是i的种类数
贝叶斯决策理论(统计决策理论)
贝叶斯决策:在类条件概率密度和先验概率已知的情况下,通过贝叶斯公式比较样本属于两类的后验概率
所以贝叶斯决策有两个要求:
①各个类别的总体概率分布(先验概率和类条件概率密度)是已知的
②要决策分类的类别数是一定的
最小错误率贝叶斯决策
最小错误率贝叶斯决策形式
最小错误率贝叶斯决策:
若 P ( w 1 ∣ x ) > P ( w 2 ∣ x ) P(w_1|x)>P(w_2|x) P(w1∣x)>P(w2∣x),则 x ∈ w 1 x∈w_1 x∈w1 ;反之, x ∈ w 2 x∈w_2 x∈w2
下面是上面公式的几个等价形式
① 若 P ( w i ∣ x ) = m a x P ( w j ∣ x ) P(w_i|x) = maxP(w_j|x) P(wi∣x)=maxP(wj∣x),则 x ∈ w i x∈w_i x∈wi
②根据贝叶斯公式及两类分母相同可以得到:
若 p ( x ∣ w i ) p ( w i ) = m a x P ( x ∣ w j ) P ( w j ) p(x|w_i)p(w_i)=maxP(x|w_j)P(w_j) p(x∣wi)p(wi)=maxP(x∣wj)P(wj) ,则 x ∈ w i x∈w_i x∈wi
③似然比形式
因为先验概率 p ( w i ) p(w_i) p(wi)是事先确定的,和样本无关,所以可以整理成似然比形式
若 l ( x ) = p ( x ∣ w 1 ) p ( x ∣ w 2