朴素贝叶斯算法理论

首先不得不说贝叶斯公式真的是一个很有用的公式,它出现在我们生活中的各个地方,只是我们没有察觉到而已。

生活中,我们可以通过贝叶斯来预估第二天的天气,判断半夜跟你聊天的女孩是否也喜欢你,发烧被确诊是新冠的概率等等。

例子一

假如头一天晚上,你和你的小伙伴兴起,准备明天外出郊游,但天气预报已经过了,不知道明天是否会下雨,该怎么办呢?

这个时候,你的小伙伴小黄就站出来了,说到:“吾夜观天象,明天应该会下雨”,你问到为啥呀,小黄答道:“因为今夜乌云密布,一般这样的天气,第二天就会降雨。”大家都默默的点头道,好像是这样子的啊。这个时候,学习成绩一向很好的小刘,嘴里仿佛在嘀咕着什么,突然他站起来说到,我认为明天不会下雨。大家一脸诧异的看着小刘,心想小刘这是咋的啦,小刘看大家一脸不解的样子,决定给大家上一课,就叫贝叶斯理论的应用。

小刘先直接粗暴的扔出一个公式,
p ( A ∣ B ) = p ( A ) p ( B ∣ A ) p ( B ) p(A|B)=\frac{p(A)p(B|A)}{p(B)} p(AB)=p(B)p(A)p(BA)
解释道,这是英国数学家贝叶斯提出的贝叶斯公式,其中:
p ( A ) p(A) p(A): 表示事件A发生的概率,叫做先验概率
p ( B ) p(B) p(B): 表示事件B发生的概率,也叫做先验概率
p ( B ∣ A ) p(B|A) p(BA): 表示事件A发生的条件下,事件B发生的概率,称作条件概率也叫后验概率。
p ( A ∣ B ) p(A|B) p(AB): 表示事件B发生的条件下,事件A发生的概率,称作条件概率也叫后验概率。

小黄一边挠头,一边一脸懵逼的看着小刘。接下来,小刘扶了扶眼镜,继续说道,我刚大概估算了一下,我们这个月,晚上多云的夜晚占了差不多70%,下雨的天数只占差不多10%,但是第二天下雨,头一天晚上多云的概率占到了60%。这一说,小黄更不解了,没等小黄开口,小刘就补充道:“但是,这并不代表明天会很大可能下雨。”,我们把事件B看作是有乌云的夜晚,事件A看作第二天会下雨的,那么我们现在来看看,当我们今晚天气多云的时候(事件B发生的时候),明天会下雨(事件A发生)的概率吧。
p ( A ∣ B ) = p ( 下 雨 ∣ 多 云 ) = p ( 下 雨 ) p ( 多 云 ∣ 下 雨 ) p ( 多 云 ) = = 0.1 ∗ 0.6 0.7 = 0.0857 p(A|B)=p(下雨|多云)=\frac{p(下雨)p(多云|下雨)}{p(多云)}==\frac{0.1 *0.6}{0.7}=0.0857 p(AB)=p()=p()p()p()==0.70.10.6=0.0857
即明天下雨的概率只有8.57%,所以我觉得明天不会下雨。说完,大家都对小刘投来了崇拜的眼光。

例子二

现在疫情仍在零星的发生,各大高校不敢放松警惕,发烧仍然是感染新冠的主要症状,所以孩子们每天都要乖乖的健康打卡,汇报自己的体温情况,当有出现发烧的同学,学校好能及时应对。

这里面其实也是应用到了贝叶斯理论。我们假设正常人发烧的概率为5%,在中国感染新冠的概率为(10万/13亿)0.00777%,感染新冠病毒后发烧的概率为95%。
这个时候我们来计算一下,如果一个同学发烧了,那么他被确诊为新冠的概率有多大:
p ( 确 诊 ∣ 发 烧 ) = p ( 确 诊 ) p ( 发 烧 ∣ 确 诊 ) p ( 发 烧 ) = 0.000077 ∗ 0.95 0.05 = 0.0015 p(确诊|发烧)=\frac{p(确诊)p(发烧|确诊)}{p(发烧)}=\frac{0.000077*0.95}{0.05}=0.0015 p()=p()p()p()=0.050.0000770.95=0.0015
可以看到,在中国,同学们发烧了不要害怕,不要自己吓自己,戴好口罩先去医院检查,因为引起发烧的原因实在太多了,天气变化,肠胃炎等等,不一定就是感染了哦,但是该做的防护还是需要做的。

ps:可能有的同学觉得公式不太好记忆,其实挺简单的,从左到右,从上到下,ABABAB,是不是和男枪有点像。

例子三

假如你是一个公司的HR,现在要去校招,根据以往招人的经验以及招来后的表现,我们发现,上一年公司总共招了100个毕业生,其中有25人来自重点大学,这25个人中有20个人的工作能力都挺不错,75个人来自普通大学,只有10个人的工作能力很不错,于是我们得到下面的表:

重点大学普通大学
2010
一般565

我们想知道招到工作能力强,且来自重点大学的概率为:
p ( A ∣ B ) = p ( 重 点 ∣ 强 ) = p ( 重 点 ) p ( 强 ∣ 重 点 ) p ( 强 ) = = 25 / 100 ∗ 20 / 25 25 / 100 ∗ 20 / 25 + 75 / 100 ∗ 10 / 75 = 2 3 p(A|B)=p(重点|强)=\frac{p(重点)p(强|重点)}{p(强)}==\frac{25/100 *20/25}{25/100 *20/25+75/100*10/75}=\frac{2}{3} p(AB)=p()=p()p()p()==25/10020/25+75/10010/7525/10020/25=32

同样的工作能力强,来自普通大学的概率为:
p ( A ˉ ∣ B ) = p ( 普 通 ∣ 强 ) = p ( 普 通 ) p ( 强 ∣ 普 通 ) p ( 强 ) = = 75 / 100 ∗ 10 / 75 25 / 100 ∗ 20 / 25 + 75 / 100 ∗ 10 / 75 = 1 3 p(\bar{A}|B)=p(普通|强)=\frac{p(普通)p(强|普通)}{p(强)}==\frac{75/100 *10/75}{25/100 *20/25+75/100*10/75}=\frac{1}{3} p(AˉB)=p()=p()p()p()==25/10020/25+75/10010/7575/10010/75=31

这也能从反面印证为什么HR喜欢招收重点大学的高校毕业生了。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值