直接举例说明,如果我10天上班,有两天迟到了,那么请问我迟到的概率是多少?答案显而易见,我们可以用 P ( 迟 到 ) P(迟到) P(迟到)表示迟到的概率,则: P ( 迟 到 ) = 2 10 = 0.2 P(迟到)=\frac{2}{10}=0.2 P(迟到)=102=0.2
这就叫做先验概率。当然,我迟到是有原因的,有可能使堵车造成的,那么在因为“迟到”引起“堵车”的这个事件中,“迟到”是一种事实结果,而造成迟到的原因是“堵车”,则“堵车”就是一种影响事实结果的条件,这种情况下就属于条件概率,在“堵车”的条件下发生“迟到”的概率就可以表示为:
P
(
迟
到
∣
堵
车
)
P(迟到|堵车)
P(迟到∣堵车),那么这个值是多少呢?从常识角度理解,下面的公式一定是成立的:
P
(
迟
到
∣
堵
车
)
=
P
(
迟
到
且
堵
车
)
P
(
堵
车
)
P(迟到|堵车)=\frac{P(迟到且堵车)}{P(堵车)}
P(迟到∣堵车)=P(堵车)P(迟到且堵车)
比如,我近10天遭遇了5次堵车,其中堵车的2两次我迟到了,那么
P
(
迟
到
∣
堵
车
)
P(迟到|堵车)
P(迟到∣堵车)的值可以表示为:
P
(
迟
到
∣
堵
车
)
=
2
/
10
5
/
10
=
0.2
÷
0.5
=
0.4
P(迟到|堵车)=\frac{2/10}{5/10}=0.2÷0.5=0.4
P(迟到∣堵车)=5/102/10=0.2÷0.5=0.4
再比如,我们扔硬币,大家都知道正面朝上的概率是0.5,而这个结论其实是建立在“我们都知道”硬币正反面概率都一样,或者“这个硬币是正常的”的条件之下,只不过这个条件经常被我们隐去,因此在一般情况下,条件概率的“条件”都是我们已知的,由因及果就是先验的条件概率,也就是知道了原因、求结果的概率。那么如果我今天又迟到了,我想知道这个迟到的事情是因为早上堵车的概率是多少?这个问题抽象成数学语言就是:**跟先验概率相反,我们由结果推导出原因的概率,这就叫后验概率,**可以表示为 P ( 堵 车 ∣ 迟 到 ) P(堵车|迟到) P(堵车∣迟到)。相当于事情发生的结果在此时变成了条件概率中的条件。类似还有,“我中午拉肚子了,是因为我吃火锅造成的概率有多大?”
后验概率是贝叶斯公式的基础(可以做原因推理),比如我迟到的原因可能有三种:堵车、拉肚子、闹钟坏了三种,假设这三种情况不可能同时发生,如果我迟到了,那么造成迟到的原因到底是什么的概率,是多少呢?这个问题很难用抛硬币来解决,因为诸如此类的实际生活中某个事件的发生条件或者结果一定是较为复杂的。比如迟到这个事件,我们已经知道了引起迟到这个事件可能的所有条件,且这些条件是彼此独立互斥的,那么迟到的概率应该等于在所有条件下引起迟到事件概率的综合,可以表达为:
P
(
迟
到
)
=
P
(
堵
车
且
迟
到
)
+
P
(
拉
肚
子
且
迟
到
)
+
P
(
闹
钟
坏
了
且
迟
到
)
P(迟到)=P(堵车且迟到)+P(拉肚子且迟到)+P(闹钟坏了且迟到)
P(迟到)=P(堵车且迟到)+P(拉肚子且迟到)+P(闹钟坏了且迟到),对于多个事件就可以这样表达:
P
(
B
)
=
∑
i
=
1
n
P
(
A
i
)
P
(
B
∣
A
i
)
P(B)=\sum_{i=1}^{n}P(A_i)P(B|A_i)
P(B)=i=1∑nP(Ai)P(B∣Ai)
这就是全概率公式,即用来进行复杂概率计算。回到刚才的问题,如果想要求哪个原因造成迟到的概率最大,就可以根据条件概率和全概率公式进行推导,即:
P
(
堵
车
∣
迟
到
)
=
P
(
堵
车
且
迟
到
)
/
P
(
迟
到
)
P(堵车|迟到)=P(堵车且迟到)/P(迟到)
P(堵车∣迟到)=P(堵车且迟到)/P(迟到)
用公式表达就是:
P
(
A
i
∣
B
)
=
P
(
A
i
)
P
(
B
∣
A
i
)
∑
j
=
1
n
P
(
A
j
)
P
(
A
j
∣
B
)
P(A_i|B)=\frac{P(A_i)P(B|A_i)}{\sum_{j=1}^{n}P(A_j)P(A_j|B)}
P(Ai∣B)=∑j=1nP(Aj)P(Aj∣B)P(Ai)P(B∣Ai)
其核心思想是,当你不能知悉一个事物的本质时,你可以依靠与事物特定本质相关的事件出现的多少去判断其本质属性出现的概率。可以举例说明,如下图所示:
某零售企业有三家供应商,分别表示为
A
1
A1
A1、
A
2
A2
A2和
A
3
A3
A3,其供应量和不合格率如上图所示。问,随机从该企业中抽取一个产品,这个产品是不合格的概率是多少呢?我们将不合格的事件用
B
B
B来表示,则有如下公式成立:
P
(
B
)
=
∑
i
=
1
3
P
(
B
∣
A
i
)
∗
P
(
A
i
)
=
P
(
B
∣
A
1
)
∗
P
(
A
1
)
+
P
(
B
∣
A
2
)
∗
P
(
A
2
)
+
P
(
B
∣
A
3
)
∗
P
(
A
3
)
P(B)=\sum_{i=1}^{3}P(B|A_i)*P(A_i)=P(B|A_1)*P(A_1)+P(B|A_2)*P(A_2)+P(B|A_3)*P(A_3)
P(B)=i=1∑3P(B∣Ai)∗P(Ai)=P(B∣A1)∗P(A1)+P(B∣A2)∗P(A2)+P(B∣A3)∗P(A3)
根据上表,
P
(
B
)
P(B)
P(B)的计算结果为:
P
(
B
)
=
500
/
1500
∗
0.1
+
400
/
1500
∗
0.13
+
600
/
1500
∗
0.11
=
0.112
P(B)=500/1500*0.1+400/1500*0.13+600/1500*0.11=0.112
P(B)=500/1500∗0.1+400/1500∗0.13+600/1500∗0.11=0.112
那么如果我随机抽到一个产品是不合格的,它最有可能是哪个供应商生产的呢?这就是由果及因的问题,就是已知一个结果为条件,问产生这个结果条件的原因是什么,那么我们就需要分别计算出这个不合格产品是
A
1
A1
A1、
A
2
A2
A2和
A
3
A3
A3产出的概率分别是多少。这是典型的由果及因的问题,可以直接使用贝叶斯概率公式进行计算。我们先求在不合格条件下供应商是
A
1
A1
A1的概率:
P
(
A
1
∣
B
)
=
P
(
A
1
)
∗
P
(
B
∣
A
1
)
P
(
B
)
=
(
500
/
1500
∗
0.1
)
/
0.112
P(A1|B)=P(A1)*\frac{P(B|A1)}{P(B)}=(500/1500*0.1)/0.112
P(A1∣B)=P(A1)∗P(B)P(B∣A1)=(500/1500∗0.1)/0.112
同理我们再求出不合格产品是
A
2
A2
A2或
A
3
A3
A3的概率是0.309和0.393。所以如果抽到了某个产品是不合格的,最有可能这个产品是来自
A
3
A3
A3供应商。在实际应用过程中,我们经常会用到贝叶斯概率的思想,比如我们去分析营销活动的渠道拉新效果,我们不能只是针对结果就行分析,我们还要按照贝叶斯定律考虑到导致这个结果的前提条件。