(一)朴素贝叶斯与贝叶斯分类器基础知识

(一)朴素贝叶斯与贝叶斯分类器基础知识

基础知识点:

贝叶斯分类算法是统计学的一种概率分类方法, 朴素贝叶斯分类是贝叶斯分类中最简单的一种.
其分类原理就是利用贝叶斯公式根据某特征的先验概率计算出其后验概率, 然后选择具有最大后验概率的类作为该特征所属的类.
之所以称之为“朴素”, 是因为贝叶斯分类只做最原始、最简单的假设: 所有的特征之间是统计独立的, 即:

假设某样本 P ( X ) P(X) P(X) a 1 , … , a n a_1,…,a_n a1,,an个属性, 那么有: P ( X ) = P ( a 1 , … , a n ) = P ( a 1 ) P ( a 2 ) … P ( a n ) P(X)=P(a_1,…,a_n )=P(a_1)P(a_2)…P(a_n) P(X)=P(a1,,an)=P(a1)P(a2)P(an)

条件概率:

P ( A ∣ B ) = P ( A ∩ B ) P ( B ) P(A|B)=\dfrac{P(A∩B)}{P(B)} P(AB)=P(B)P(AB)
有: P ( A ∩ B ) = P ( A ∣ B ) P ( B ) , P ( A ∩ B ) = P ( B ∣ A ) P ( A ) P(A∩B)=P(A|B)P(B), P(A∩B)=P(B|A)P(A) P(AB)=P(AB)P(B),P(AB)=P(BA)P(A)
进一步: P ( A ∣ B ) P ( B ) = P ( B ∣ A ) P ( A ) P(A|B)P(B)=P(B|A)P(A) P(AB)P(B)=P(BA)P(A)

如果 A i A_i Ai独立同分布, P ( B ∣ A ) = P ( B ∣ A 1 ) … P ( B ∣ A n ) P(B|A)=P(B|A_1 )…P(B|A_n ) P(BA)=P(BA1)P(BAn)

贝叶斯公式:

因此贝叶斯公式为:
P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B)=P(B|A)\dfrac{P(A)}{P(B)} P(AB)=P(BA)P(B)P(A)

全概率公式:

如果事件 A = A 1 , … , A n A={A_1,…,A_n} A=A1,,An构成一个完备事件组且 P ( A i ) > 0 P(A_i )>0 P(Ai)>0, 那么对于任意一个事件 B B B则有:
P ( B ) = P ( B ⋅ 1 ) = P ( B A 1 ) + ⋯ + P ( B A n ) = P ( B ∣ A 1 ) P ( A 1 ) + ⋯ + P ( B ∣ A n ) P ( A n ) P(B)=P(B⋅1)=P(BA_1 )+⋯+P(BA_n )=P(B|A_1 )P(A_1 )+⋯+P(B|A_n )P(A_n ) P(B)=P(B1)=P(BA1)++P(BAn)=P(BA1)P(A1)++P(BAn)P(An)

因此有:
P ( B ) = ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P(B)=∑_{i=1}^nP(A_i )P(B|A_i ) P(B)=i=1nP(Ai)P(BAi)

贝叶斯推断:

根据条件概率和全概率公式, 贝叶斯公式为:
P ( A ∣ B ) = P ( A ) P ( B ∣ A ) P ( B ) P(A|B)=P(A)\dfrac{P(B|A)}{P(B)} P(AB)=P(A)P(B)P(BA)
P ( A i ∣ B ) = P ( A i ) P ( B ∣ A i ) P ( B ) = P ( A i ) P ( B ∣ A i ) ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P(A_i |B)=P(A_i )\dfrac{P(B|A_i )}{P(B)} =P(A_i ) \dfrac{P(B|A_i )}{∑_{i=1}^nP(A_i )P(B|A_i ) } P(AiB)=P(Ai)P(B)P(BAi)=P(Ai)i=1nP(Ai)P(BAi)P(BAi)
P ( A ) P(A) P(A)是类先验概率(Prior probability), 即在 B B B事件发生之前, 我们对 A A A事件概率的一个判断.
P ( A ∣ B ) P(A|B) P(AB)是类后验概率(Posterior probability)/类条件概率, 即在 B B B事件发生之后, 我们对A事件概率的重新评估. 贝叶斯分类器算的就是 P ( A ∣ B ) P(A|B) P(AB).
P ( B ∣ A ) P ( B ) \dfrac{P(B|A)}{P(B)} P(B)P(BA)是可能性函数(Likely hood), 这是一个调整因子, 使得预估概率更接近真实概率.

所以: 后验概率 = 先验概率 * 调整因子.

如果 P ( B ∣ A ) P ( B ) > 1 \dfrac{P(B|A)}{P(B)} >1 P(B)P(BA)>1, 意味着 “先验概率” 被增强, 事件 A A A的发生可能性变大;
如果 P ( B ∣ A ) P ( B ) = 1 \dfrac{P(B|A)}{P(B)} =1 P(B)P(BA)=1, 意味着 B B B事件无助于判断事件 A A A发生的可能性;
如果 P ( B ∣ A ) P ( B ) < 1 \dfrac{P(B|A)}{P(B)} <1 P(B)P(BA)<1, 意味着 “先验概率” 被削弱, 事件 A A A的发生可能性变小.


朴素贝叶斯分类器的例子:

在这里插入图片描述

图1 特性-分类的统计数据

假设某男子(帅, 性格不好, 不上进)向该女生求婚, 该女生嫁还是不嫁?
P ( A ∣ B ) = P ( A ) P ( B ∣ A ) P ( B ) P(A|B)=P(A)\dfrac{P(B|A)}{P(B)} P(AB)=P(A)P(B)P(BA)
转换成任务表达式: P ( 类 别 ∣ 特 征 ) = P ( 类 别 ) P ( 特 征 ∣ 类 别 ) P ( 特 征 ) P(类别|特征)=P(类别)\dfrac{P(特征|类别)}{P(特征)} P()=P()P()P() ; A A A A ˉ \bar{A} Aˉ为类别; B i B_i Bi为不同的特征
在朴素贝叶斯中, 假设类别B中的属性是相互独立的, 即 P ( B ∣ A ) = P ( B 1 ∣ A ) … P ( B m ∣ A ) , P(B|A)=P(B_1 |A)…P(B_m |A), P(BA)=P(B1A)P(BmA), 所以:
P ( A ∣ B ) = P ( A ) ) P ( B 1 ∣ A ) P ( B 2 ∣ A ) P ( B 3 ∣ A ) P ( A ) P ( B 1 ∣ A ) P ( B 2 ∣ A ) P ( B 3 ∣ A ) + P ( A ˉ ) P ( B 1 ∣ A ˉ ) P ( B 2 ∣ A ˉ ) P ( B 3 ∣ A ˉ ) P(A|B)=P(A))\dfrac{P(B_1 |A)P(B_2 |A)P(B_3 |A)}{P(A)P(B_1 |A)P(B_2 |A)P(B_3 |A)+P(\bar{A})P(B_1 |\bar{A})P(B_2 |\bar{A})P(B_3 |\bar{A})} P(AB)=P(A))P(A)P(B1A)P(B2A)P(B3A)+P(Aˉ)P(B1Aˉ)P(B2Aˉ)P(B3Aˉ)P(B1A)P(B2A)P(B3A)

P ( A ˉ ∣ B ) = P ( A ˉ ) P ( B 1 ∣ A ˉ ) P ( B 2 ∣ A ˉ ) P ( B 3 ∣ A ˉ ) P ( A ) P ( B 1 ∣ A ) P ( B 2 ∣ A ) P ( B 3 ∣ A ) + P ( A ˉ ) P ( B 1 ∣ A ˉ ) P ( B 2 ∣ A ˉ ) P ( B 3 ∣ A ˉ ) P(\bar{A}|B)=P(\bar{A})\dfrac{P(B_1 |\bar{A})P(B_2 |\bar{A})P(B_3 |\bar{A})}{P(A)P(B_1 |A)P(B_2 |A)P(B_3 |A)+P(\bar{A})P(B_1 |\bar{A})P(B_2 |\bar{A})P(B_3 |\bar{A})} P(AˉB)=P(Aˉ)P(A)P(B1A)P(B2A)P(B3A)+P(Aˉ)P(B1Aˉ)P(B2Aˉ)P(B3Aˉ)P(B1Aˉ)P(B2Aˉ)P(B3Aˉ)

问题的解决方法是: 最后算出来 P ( 嫁 ∣ 帅 ; 性 格 不 好 ; 不 上 进 ) P(嫁|帅;性格不好;不上进) P(;;) P ( 不 嫁 ∣ 帅 ; 性 格 不 好 ; 不 上 进 ) P(不嫁|帅;性格不好;不上进) P(;;)的概率, 哪个值大就选哪一个. 其中:
P ( 嫁 ∣ 帅 ; 性 格 不 好 ; 不 上 进 ) = P ( 嫁 ) ( P ( 帅 ∣ 嫁 ) P ( 性 格 不 好 ∣ 嫁 ) P ( 不 上 进 ∣ 嫁 ) ) P ( 帅 ; 性 格 不 好 ; 不 上 进 ) P(嫁|帅;性格不好;不上进)=P(嫁)\dfrac{(P(帅|嫁)P(性格不好|嫁)P(不上进|嫁))}{P(帅;性格不好;不上进)} P(;;)=P()P(;;)(P()P()P())

P ( 不 嫁 ∣ 帅 ; 性 格 不 好 ; 不 上 进 ) = P ( 不 嫁 ) ( P ( 帅 ∣ 不 嫁 ) P ( 性 格 不 好 ∣ 不 嫁 ) P ( 不 上 进 ∣ 不 嫁 ) ) P ( 帅 ; 性 格 不 好 ; 不 上 进 ) P(不嫁|帅;性格不好;不上进)=P(不嫁)\dfrac{(P(帅|不嫁)P(性格不好|不嫁)P(不上进|不嫁))}{P(帅;性格不好;不上进)} P(;;)=P()P(;;)(P()P()P())

P ( B ) = ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P(B)=∑_{i=1}^nP(A_i )P(B|A_i ) P(B)=i=1nP(Ai)P(BAi) :
P ( 帅 ; 性 格 不 好 ; 不 上 进 ) = P ( 嫁 ) P ( 帅 │ 嫁 ) P ( 性 格 不 好 │ 嫁 ) P ( 不 上 进 │ 嫁 ) + P ( 不 嫁 ) P ( 帅 │ 不 嫁 ) P ( 性 格 不 好 │ 不 嫁 ) P ( 不 上 进 │ 不 嫁 ) P(帅;性格不好;不上进)=P(嫁)P(帅│嫁)P(性格不好│嫁)P(不上进│嫁)+P(不嫁)P(帅│不嫁)P(性格不好│不嫁)P(不上进│不嫁) P(;;)=P()P()P()P()+P()P()P()P()
由表中数据, 有:
分子:
P ( 嫁 ) P ( 帅 │ 嫁 ) P ( 性 格 不 好 │ 嫁 ) P ( 不 上 进 │ 嫁 ) = 5 / 10 × 4 / 5 × 1 / 5 × 1 / 5 = 2 / 125 P(嫁)P(帅│嫁)P(性格不好│嫁)P(不上进│嫁)=5/10×4/5×1/5×1/5=2/125 P()P()P()P()=5/10×4/5×1/5×1/5=2/125
P ( 不 嫁 ) P ( 帅 │ 不 嫁 ) P ( 性 格 不 好 │ 不 嫁 ) P ( 不 上 进 │ 不 嫁 ) = 5 / 10 × 1 / 5 × 3 / 5 × 2 / 5 = 3 / 125 P(不嫁)P(帅│不嫁)P(性格不好│不嫁)P(不上进│不嫁)=5/10×1/5×3/5×2/5=3/125 P()P()P()P()=5/10×1/5×3/5×2/5=3/125
分母:

P ( 帅 ; 性 格 不 好 ; 不 上 进 ) = 2 / 125 + 3 / 125 = 5 / 125 P(帅;性格不好;不上进)=2/125+3/125=5/125 P(;;)=2/125+3/125=5/125
最终结果:
P ( 嫁 ∣ 帅 ; 性 格 不 好 ; 不 上 进 ) = 2 / 125 ÷ / 5 / 125 = 0.4 P(嫁|帅;性格不好;不上进)=2/125÷/5/125=0.4 P(;;)=2/125÷/5/125=0.4
P ( 不 嫁 ∣ 帅 ; 性 格 不 好 ; 不 上 进 ) = 3 / 125 ÷ 5 / 125 = 0.6 P(不嫁|帅;性格不好;不上进)=3/125÷5/125=0.6 P(;;)=3/125÷5/125=0.6

所以, 女生选择不嫁给该男子.

看懂了这个二维朴素贝叶斯分类器的例子, 就可以推广到一般情况了. 见(二)朴素贝叶斯与贝叶斯分类器.

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值