事件 A 在事件 B 发生的条件下与事件 B 在事件 A 发生的条件下,它们两者的概率并不相同,但是它们两者之间存在一定的相关性,并具有以下公式(称之为“贝叶斯公式”):
P(A)表示A发生的概率
P(B)表示B发生的概率
P(A|B)表示B条件下A发生的概率,这个结果也称“后验概率”
P(B|A)表示A条件下B发生的概率
问题:某公园男性穿凉鞋的概率为 1/2,女性穿凉鞋的概率为 2/3 ,并且该公园中男女比例通常为 2:1 ,问题:若你在公园中随机遇到一个穿凉鞋的人,请问他的性别为男性或女性的概率分别为多少?
先验概率
是利用已知经验得出的概率,设定:假设某公园中一个人是男性的概率是P(men),是女性则是P(women),一个人穿凉鞋的概率为P(x1),未穿凉鞋的概率为P(x0)。而一个人的性别与是否穿凉鞋这两个事件之间是相互独立的。这四个概率就是先验概率,可通过全概率公式求得。
条件概率
在y发生的条件下,x发生的概率。
其中分子位x和y同时发生的概率,为联合概率。
公园男性穿凉鞋的概率为 1/2,女性穿凉鞋的概率为 2/3就为条件概率
全概率公式
如果事件 Y=y1,Y=y2,...,Y=yn可构成一个完备事件组,即它们两两互不相容,其和为全集。则对于事件 X=x有:
比如:x=“一个人穿凉鞋”可以由y=“男的穿凉鞋”和y=“女的穿凉鞋”组成,
所以可以计算P(x1)和P(x0)的概率:
后验概率
某事件 X=x 已经发生,那么该事件是因为事件 Y=y 的而发生的概率。也就是上例中所需要求解的“在知道一个人穿拖鞋的前提下,这个人是男性的概率或者是女性的概率是多少”。后验概率形式化便是:P(men|x1)
后验概率的计算要以先验概率为基础。后验概率可以根据通过贝叶斯公式,用先验概率和似然函数计算出来。
文氏图表示: