我们知道两件独立的事件 A、B同时发生的概率是这样计算的:
P(AB) = P(A)*P(B) #AB两件事情不会相互影响
但是生活中的事情总是相互影响的,比如说今天下雨与明天下雨:
对于这样的两个事件:
P(AB) = P(A)*P(B|A)
或 P(AB) = P(B)*P(A|B) #AB两件事情相互影响
由上面的式子,我们得到:
P(A)*P(B|A) = P(B)*P(A|B)
进而得到:
P(A|B) = P(A)*P(B|A) / P(B)
上式便是贝叶斯定理!
贝叶斯定理的经典例子:
曲奇饼干问题
有两个碗,碗1中有香草味饼干30块和巧克力味饼干10块;碗2中香草味和巧克力味饼干各20块。假设你蒙住双眼,从一个碗中拿一块饼干,通过品尝你发现是香草味的。那么问题来了,这块儿饼干是从碗1中拿的概率是多少?
我们将上述问题抽象:
A:拿饼干时选中的是碗1
B:从任意碗中拿到一块香草味饼干
那么这块饼干是从碗1中拿的可以表示为:
P(A|B) # 待求 已知是香草味饼干,来自碗1的概率
P(A) = 0.5
P(B) = 50/80 = 5/8
P(B|A) = 30/40 = 3/4 #已知选择了碗1,得到一块香草饼干的概率
那么由贝叶斯定理:
P(A|B) = P(A)*P(B|A) / P(B) = 0.6
通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的。
贝叶斯要解决的就是P(A|B)和P(B|A)的相互推导问题。
贝叶斯在实际上的运用:
第一天下雨第二天也下雨–>知道某天下雨,前一天下雨了吗?
垃圾邮件中出现某些关键字–>出现某些关键字是垃圾邮件吗?