基础概念:
(1)联合概率
P(AB)或者P(A,B):在整个事件中,A,B同时发生的概率。
(2)条件概率
P(A|B):在B发生的情况下,A发生的概率。
P(B|A):在A发生的情况下,B发生的概率。
(3)边缘概率
P(A):整个事件中,A发生的概率
P(B):整个事件中,B发生的概率
(4)联合概率、条件概率、边缘概率的关系
在整个事件中,共有以下五种情况:
X=1,Y=1;
X=2,Y=1;
X=1,Y=2;
X=2,Y=2
X=3,Y=1;
定义:A事件为X=1;B事件为Y=2
P(A|B)=1/2
P(B)= 2/5
P(A,B)=1/5
P(A|B)*P(B)=P(A,B)=P(B,A)
同理可求:P(B|A)*P(A)=P(B,A)=P(A,B)
(5)先验概率
知道原因推结果 P(原因) ,P(结果|原因)
(6)后验概率
知道结果推原因 P(原因|结果)
实例
某个医院早上收了六个门诊病人,如下表。
症状 职业 疾病
打喷嚏 护士 感冒
打喷嚏 农夫 过敏
头痛 建筑工人 脑震荡
头痛 建筑工人 感冒
打喷嚏 教师 感冒
头痛 教师 脑震荡
现在又来了第七个病人,是一个打喷嚏的建筑工人。请问他患上感冒的概率有多大?也就是求:P(感冒|打喷嚏、建筑工人)=?
根据贝叶斯定理:
P(A|B) = P(B|A) P(A) / P(B)
可知:
P(感冒|打喷嚏x建筑工人)= (P(打喷嚏x建筑工人|感冒) x P(感冒)) / P(打喷嚏x建筑工人)
由于:
P(打喷嚏x建筑工人|感冒)=P(打喷嚏|感冒)xP(建筑工人|感冒)
所以:
P(感冒|打喷嚏x建筑工人)= (P(打喷嚏|感冒)xP(建筑工人|感冒) x P(感冒)) / P(打喷嚏)x P(建筑工人)
根据上表计算可知:
P(打喷嚏|感冒)=2/3
P(建筑工人|感冒) =1/3
P(感冒)=12
P(打喷嚏)=1/2
P(建筑工人) =1/3
P(感冒|打喷嚏x建筑工人)=(2/3 x 1/3 x 1/2)/(1/2 x 1/3)=0.66
**因此,**这个打喷嚏的建筑工人,有66%的概率是得了感冒。同理,可以计算这个病人患上过敏或脑震荡的概率。比较这几个概率,就可以知道他最可能得什么病。