首先不得不说贝叶斯公式真的是一个很有用的公式,它出现在我们生活中的各个地方,只是我们没有察觉到而已。
生活中,我们可以通过贝叶斯来预估第二天的天气,判断半夜跟你聊天的女孩是否也喜欢你,发烧被确诊是新冠的概率等等。
例子一
假如头一天晚上,你和你的小伙伴兴起,准备明天外出郊游,但天气预报已经过了,不知道明天是否会下雨,该怎么办呢?
这个时候,你的小伙伴小黄就站出来了,说到:“吾夜观天象,明天应该会下雨”,你问到为啥呀,小黄答道:“因为今夜乌云密布,一般这样的天气,第二天就会降雨。”大家都默默的点头道,好像是这样子的啊。这个时候,学习成绩一向很好的小刘,嘴里仿佛在嘀咕着什么,突然他站起来说到,我认为明天不会下雨。大家一脸诧异的看着小刘,心想小刘这是咋的啦,小刘看大家一脸不解的样子,决定给大家上一课,就叫贝叶斯理论的应用。
小刘先直接粗暴的扔出一个公式,
p
(
A
∣
B
)
=
p
(
A
)
p
(
B
∣
A
)
p
(
B
)
p(A|B)=\frac{p(A)p(B|A)}{p(B)}
p(A∣B)=p(B)p(A)p(B∣A)
解释道,这是英国数学家贝叶斯提出的贝叶斯公式,其中:
p
(
A
)
p(A)
p(A): 表示事件A发生的概率,叫做先验概率
p
(
B
)
p(B)
p(B): 表示事件B发生的概率,也叫做先验概率
p
(
B
∣
A
)
p(B|A)
p(B∣A): 表示事件A发生的条件下,事件B发生的概率,称作条件概率也叫后验概率。
p
(
A
∣
B
)
p(A|B)
p(A∣B): 表示事件B发生的条件下,事件A发生的概率,称作条件概率也叫后验概率。
小黄一边挠头,一边一脸懵逼的看着小刘。接下来,小刘扶了扶眼镜,继续说道,我刚大概估算了一下,我们这个月,晚上多云的夜晚占了差不多70%,下雨的天数只占差不多10%,但是第二天下雨,头一天晚上多云的概率占到了60%。这一说,小黄更不解了,没等小黄开口,小刘就补充道:“但是,这并不代表明天会很大可能下雨。”,我们把事件B看作是有乌云的夜晚,事件A看作第二天会下雨的,那么我们现在来看看,当我们今晚天气多云的时候(事件B发生的时候),明天会下雨(事件A发生)的概率吧。
p
(
A
∣
B
)
=
p
(
下
雨
∣
多
云
)
=
p
(
下
雨
)
p
(
多
云
∣
下
雨
)
p
(
多
云
)
=
=
0.1
∗
0.6
0.7
=
0.0857
p(A|B)=p(下雨|多云)=\frac{p(下雨)p(多云|下雨)}{p(多云)}==\frac{0.1 *0.6}{0.7}=0.0857
p(A∣B)=p(下雨∣多云)=p(多云)p(下雨)p(多云∣下雨)==0.70.1∗0.6=0.0857
即明天下雨的概率只有8.57%,所以我觉得明天不会下雨。说完,大家都对小刘投来了崇拜的眼光。
例子二
现在疫情仍在零星的发生,各大高校不敢放松警惕,发烧仍然是感染新冠的主要症状,所以孩子们每天都要乖乖的健康打卡,汇报自己的体温情况,当有出现发烧的同学,学校好能及时应对。
这里面其实也是应用到了贝叶斯理论。我们假设正常人发烧的概率为5%,在中国感染新冠的概率为(10万/13亿)0.00777%,感染新冠病毒后发烧的概率为95%。
这个时候我们来计算一下,如果一个同学发烧了,那么他被确诊为新冠的概率有多大:
p
(
确
诊
∣
发
烧
)
=
p
(
确
诊
)
p
(
发
烧
∣
确
诊
)
p
(
发
烧
)
=
0.000077
∗
0.95
0.05
=
0.0015
p(确诊|发烧)=\frac{p(确诊)p(发烧|确诊)}{p(发烧)}=\frac{0.000077*0.95}{0.05}=0.0015
p(确诊∣发烧)=p(发烧)p(确诊)p(发烧∣确诊)=0.050.000077∗0.95=0.0015
可以看到,在中国,同学们发烧了不要害怕,不要自己吓自己,戴好口罩先去医院检查,因为引起发烧的原因实在太多了,天气变化,肠胃炎等等,不一定就是感染了哦,但是该做的防护还是需要做的。
ps:可能有的同学觉得公式不太好记忆,其实挺简单的,从左到右,从上到下,ABABAB
,是不是和男枪有点像。
例子三
假如你是一个公司的HR,现在要去校招,根据以往招人的经验以及招来后的表现,我们发现,上一年公司总共招了100个毕业生,其中有25人来自重点大学,这25个人中有20个人的工作能力都挺不错,75个人来自普通大学,只有10个人的工作能力很不错,于是我们得到下面的表:
重点大学 | 普通大学 | |
---|---|---|
强 | 20 | 10 |
一般 | 5 | 65 |
我们想知道招到工作能力强,且来自重点大学的概率为:
p
(
A
∣
B
)
=
p
(
重
点
∣
强
)
=
p
(
重
点
)
p
(
强
∣
重
点
)
p
(
强
)
=
=
25
/
100
∗
20
/
25
25
/
100
∗
20
/
25
+
75
/
100
∗
10
/
75
=
2
3
p(A|B)=p(重点|强)=\frac{p(重点)p(强|重点)}{p(强)}==\frac{25/100 *20/25}{25/100 *20/25+75/100*10/75}=\frac{2}{3}
p(A∣B)=p(重点∣强)=p(强)p(重点)p(强∣重点)==25/100∗20/25+75/100∗10/7525/100∗20/25=32
同样的工作能力强,来自普通大学的概率为:
p
(
A
ˉ
∣
B
)
=
p
(
普
通
∣
强
)
=
p
(
普
通
)
p
(
强
∣
普
通
)
p
(
强
)
=
=
75
/
100
∗
10
/
75
25
/
100
∗
20
/
25
+
75
/
100
∗
10
/
75
=
1
3
p(\bar{A}|B)=p(普通|强)=\frac{p(普通)p(强|普通)}{p(强)}==\frac{75/100 *10/75}{25/100 *20/25+75/100*10/75}=\frac{1}{3}
p(Aˉ∣B)=p(普通∣强)=p(强)p(普通)p(强∣普通)==25/100∗20/25+75/100∗10/7575/100∗10/75=31
这也能从反面印证为什么HR喜欢招收重点大学的高校毕业生了。