朴素贝叶斯与贝叶斯的显著不同就是朴素贝叶斯进行了独立性假设,假设各个特征之间不相关。
P ( 分 类 ∣ 特 征 ) = P ( 分 类 ) P ( 特 征 ∣ 分 类 ) P ( 特 征 ) P(分类|特征)=\frac{P(分类)P(特征|分类)}{P(特征)} P(分类∣特征)=P(特征)P(分类)P(特征∣分类)
后验概率=先验概率*调整因子
例题:在夏季,某公园男性穿凉鞋的概率为1/2,女性穿凉鞋的概率为2/3,并且该公园中男女比例通常为2:1。问:若你在公园中随机遇到一个穿凉鞋的人,请问他的性别为男性或女性的概率分别为多少?
解:设事件A为{公园里随机遇到的是男性};事件B为{该人穿凉鞋};事件C为{公园里随机遇到的是女性}。
由题意得P(A)=2/3,P©=1/3;先验概率P(B|A)=1/2,P(B|C)=2/3
由全概率公式得: P ( B ) = P ( A ) ∗ P ( B ∣ A ) + P ( C ) ∗ P ( B ∣ C ) = 5 9 P(B)=P(A)*P(B|A)+P(C)*P(B|C)=\frac{5}{9} P(B)=P(A)∗P(B∣A)+P(C)∗P(B∣C)=95
由贝叶斯定理得: P ( A ∣ B ) ∗ P ( B ) = P ( B ∣ A ) P ( A ) P(A|B)*P(B)=P(B|A)P(A) P(A∣B)∗P(B)=P(B∣A)P(A)
同除P(B)得性别为男性的概率为 P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) = 3 5 P(A|B)=\frac{P(B|A)P(A)}{P(B)}=\frac{3}{5} P(A∣B)=P(B)P(B∣A)P(A)=53
同理可得得性别为女性的概率为 P ( C ∣ B ) = P ( B ∣ C ) P ( C ) P ( B ) = 2 5 P(C|B)=\frac{P(B|C)P(C)}{P(B)}=\frac{2}{5} P(C∣B)=P(B)P(B∣C)P(C)=52
贝叶斯公式就是当已知结果,问导致这个结果的第i原因的可能性是多少?执果索因!
在贝叶斯法则中,每个名词都有约定俗成的名称:
P(A)是A的先验概率或边缘概率。之所以称为"先验"是因为它不考虑任何B方面的因素。
P(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。
P(B|A)是已知A发生后B的条件概率,也由于得自A的取值而被称作B的后验概率。
P(B)是B的先验概率或边缘概率,也作标准化常量(normalized constant)。
按这些术语,Bayes法则可表述为:
后验概率 = (似然度 * 先验概率)/标准化常量 也就是说,后验概率与先验概率和似然度的乘积成正比。