可怕的贝叶斯定理,看完后忍不住感慨数学太重要了

学多点知识

  你好我也好

  广州又在下大暴雨了,超模君还是一如既往待在工作室码着字!

  OpcyD6ziWRcqC8DhOSPqecJvhGCrrLwgFWUiRedza0ke81505052634155transferflag.png

  (看图猜地方,猜对了,送你一个糖)

  即便天气不好,也不能冷落我的模友们,那今天先来讲讲贝叶斯定理。

  估计开始了,那就拿好小板凳。

  众所周知,贝叶斯定理是一种在已知其他概率的情况下求概率的方法:

  gQeLnsqHL9h46Az8qqZVYjDlRyDX3dAxNB0Qmlnq66zH51505052634156transferflag.png

  图片来源:HackYourself

  既然开讲了,那就不要停下来了。

  那我们怎么去理解这个传说中不黄但很暴力的贝叶斯定理呢,贝叶斯定理是如何暴力狂虐数学界的?

  首先,对于贝叶斯定理,还是要先了解各个概率所对应的事件。

  

 

  P(A|B) 是在 B 发生的情况下 A 发生的概率;

  P(A) 是 A 发生的概率;

  P(B|A) 是在 A 发生的情况下 B 发生的概率;

  P(B) 是 B 发生的概率。

  

 

  还没看懂。。。那我还是举个栗子吧

  京西大旅馆为了庆祝开业三周年的好日子,老板刘强西准备带着实习生小天去郊外旅游,不过一大早天空多云:

  

 

  糟了!50%的雨天的早上是多云的!

  但多云的早上其实挺多的(大约40%的日子早上是多云的)!

  这个月干旱为主(平均30天里一般只有3天会下雨,10%)!

  

 

  刘强西45°角仰望天空,想着要不要去郊游。。。

  作为聪明的实习生,小天立马拿出他的小本子:

  NICEIKX8A73wRGrDg9KOow47mAShmlAzIJ1ooJ=XTvwlk1505052634406.gif

  此时,我们用"雨"来代表今天下雨,"云"来代表早上多云。

  当早上多云时,当天会下雨的可能性是 P(雨|云)。

  P(雨|云) = P(雨)·P(云|雨)/P(云)

  

 

  P(雨) 是今天下雨的概率 = 10%

  P(云|雨) 是在下雨天早上有云的概率 = 50%

  P(云) 早上多云的概率 = 40%

  

 

  基本的概率情况已经确定,那就简单了

  P(雨|云)=0.1×0.5/0.4=0.125

  小天:刘老板,不用看天气了,今天下午的概率只有12.5%,可以去郊游的。

  刘强西听完后:行,那赶紧上车!

  然而,“小天”算不如天算,你看,天就下雨了。。。

  小天尴尬ing

  IEcv01K4sbgUbbUgv00M6MlVFwZormIfKmqtPFxT02lXP1505052634536.gif

  故事到这里还没结束,超模君当时在学习贝叶斯定理的时候,时常会记不住到底是B在前,还是A在前,公式该怎么写。

  直到有一次,小天(这个小天是超模君的小天,不是刘强西的小天)看我在写贝叶斯公式,说出:AB AB AB。

  0yoCIUX8tVi804Ww0jJaNfUsTHS2Ku1f8LK6jwQMLiqkc1505052634746transferflag.png

  所以对于贝叶斯公式,记住AB AB AB,然后再做分组:"AB = A×BA/B"

  

  别急,假如“A”还有两个可能

  各位模友,你们听说“假阳性”、“假阴性”这两个词吗?

  是的,没错,就是某些疾病检测一般喜欢用名词,医学院的同学赶紧拿好小板凳,接下来就是考试重点了。

  贝叶斯定理虽然只是一个概率计算公式,但其最著名的一个用途便是“假阳性”和“假阴性”检测。

  再丢个栗子。。。

  上次没出成郊游,刘强西却在路边捡了一只小流浪猫回京西大旅馆,每天就顾着撸猫。。。

  YDtDe99va800C67ApuAlK3RqgBZWFccVsIytC8AMXDHcw1505052634877.gif

  两天过后,刘强西突然浑身发痒,小天就想起来是不是刘强西对猫过敏,于是刘强西就做了一个简单的过敏检测:

  

 

  对于真的有这种过敏的人,检测有80%的机会给回 "有" 的结果;

  对于没有10%的机会给回 "有" 的结果(而这种情况,称之为"假阳性")。

  

 

  从实际情况看,京西大旅馆的村子有 1% 的人有这种过敏,而刘强西的检测结果是 "有",那么刘强西真的有这种过敏的可能性有多大?

  TOokGn8msxlWLVdqQsh5L8Z1z9O4OBoRwGaCyhE6gH7mG1505052635040transferflag.png

  

 

  P(过敏) 是有这种过敏的概率 = 1%

  P(有|过敏) 是对于真的有这种过敏的人,检测的结果是 "有" = 80%

  P(有) 是对于任何人,检测的结果是"有" = ??%

  

 

  糟糕!我们并不知道检测结果是 "有" 的一般可能性是多少……

  不过我们可以把有这种过敏和没有这种过敏的概率相加来求这个一般概率:

  

 

  1% 的人有这种过敏,检测对 80% 的这些人说 "有"

  99% 的人没有这种过敏,检测对 10% 的这些人说 "有"

  

 

  把概率加起来:

  P(有) = 1% × 80% + 99% × 10% = 10.7%

  就是说大约 10.7% 的人会得到 "有" 的检测结果。

  那此时我们就可以计算出,刘强西真正对猫过敏的概率为

  P(过敏|有) = 1% × 80%/10.7%= 7.48%

  

  所以此时也就有了贝叶斯定理特别版:

  

  MjHseH9gAX32S3r8IfH32fA7Bd1LmpBfh0K0ROFS6VjSS1505052635207transferflag.png

  最后说多两句:

  贝叶斯统计作为常用的基础算法,不要小看其作用,其在机器学习中是占据重要的一席之地。尤其是在数据处理方面,针对事件发生的概率以及事件可信度分析上具有良好的分类效果。

  xGs3c0X042HD=Rzg1l5BVowyjAWu=i9zWyPkncnuLj5qb1505052635273transferflag.png

转载于:https://my.oschina.net/u/855913/blog/3065794

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值