五分钟了解先验概率和后验概率

五分钟了解先验概率和后验概率

本文摘自我的公众号【车子的心智探索】
欢迎关注我!

在这里插入图片描述

不理解先验概率和后验概率?莫慌,本文可以帮你。

从面积的角度看概率

在说正题之前,咱们从面积的角度认识一下概率。

拿掷骰子来说,每个点的概率是相等的,因为总概率是 1,所以每个点数的概率是 1/6。我们用格子的大小来表示概率,那么掷骰子的概率图是这样的:

在这里插入图片描述

如果把掷出的点数小于等于 4 记作事件 F,问你 P(F) 等于多少,你会说等于 4/6 = 2/3.

如果用面积图来算呢?把对应点数的面积加起来就可以。

四个方块的面积之和 = 1/6 * 4 = 2/3

在这里插入图片描述

某种可能性消失

我洗好了 52 张扑克牌摆在你面前,扑克牌背面朝上。如果我问你,最上面这张是黑桃的概率是多少?你肯定会说四分之一。因为扑克牌共有四种花色,每一种花色的可能性都是相等的。

但是,我趁你不注意的时候偷看了一眼最上面的牌,然后告诉你这张牌是黑色的。这时候我再问你,最上面这张是黑桃的概率是多少?

因为已经确定花色是黑色,所以红桃或方块的可能性不存在了,只有可能是黑桃或梅花,所以,你推测这张牌是黑桃的概率为二分之一。

画图解释就是:

在这里插入图片描述

从面积角度看,整个过程是这样的:

在这里插入图片描述

当得知花色是黑色的时候,表示红桃和方块的两个方形不见了,只剩下黑桃和梅花,因为概率之和总是 1,所以把它们各自的面积向上伸展,直到总和为 1。注意,在伸展的同时要保持黑桃和梅花的面积比例不变,于是结果就是各占 1/2。

当然,也可以更简单,既然要保持黑桃和梅花的面积比例不变,不妨假设都伸展 k 倍。

黑 桃 的 面 积 总 面 积 = 1 4 k 1 4 k + 1 4 k = 1 4 1 4 + 1 4 = 1 2 \frac{黑桃的面积}{总面积}=\frac{\frac{1}{4}k}{\frac{1}{4}k+\frac{1}{4}k}=\frac{\frac{1}{4}}{\frac{1}{4}+\frac{1}{4}}=\frac{1}{2} =41k+41k41k=41+4141=21

又因为总面积为 1,所以黑桃的面积是 1/2.

好了,进入正题。

先验概率与后验概率

看这样一个问题:

假设某种癌症的患病率为0.1%(0.001)。有一个简易的方法能够检查出是否患病,但是不能百分之百检查出——患上这种癌症的人中有 95%(0.95)的概率被诊断为阳性;另一方面,健康人群也有 2%(0.02)的可能性被误诊为阳性。如果你的检查结果是阳性,请问你实际患上这种癌症的概率为多少?

这里的患病率就是先验概率。

如果要在检查前推测自己是否罹患这种癌症,概率图如下。左侧条形的面积是 0.001,右侧矩形的面积是 0.999,分别表示得癌症的概率和健康的概率。

在这里插入图片描述

通过流行病学数据可知,这种癌症的罹患率为 0.001。也就是说,1000 人中有 1 人罹患这种癌症。在没有任何个人信息的情况下,你属于图中左侧世界的概率是 0.001,属于右侧世界的概率是 0.999。

按照题目信息,可以制作一个表格。

在这里插入图片描述

先看癌症患者这行,在患癌症的情况下,检查结果呈阳性的概率为 0.95。也就是说,如果你真得了癌症,能检查出来的概率为 95%。还有 5% 的概率查不出来。

再看健康者这行,如果你是健康人,那么误诊为阳性的概率为 2%,准确诊断为阴性的概率是 98%。

所以,检查存在着误诊的风险。所谓的风险包含以下两种情况:

  1. 身患癌症,却诊断没有患病
  2. 健康,却误诊为患病

在前面那张图的基础上,我们可以根据阳性率和阴性率继续分割。

左侧是患癌症这一类别,把这个条形按照面积之比 0.95:0.05 来分割 ,那么患癌呈阳性的概率是 0.001*0.95;同理,可以算出其他三部分的概率(面积)。

在这里插入图片描述

当你做完检查,肯定属于以下四种可能性中的一种:

  1. 患癌并呈现阳性(左上区域)
  2. 患癌并呈现阴性(左下区域)
  3. 健康并呈现阳性(右上区域)
  4. 健康并呈现阴性(右下区域)

再回到原题,你的检查结果呈阳性,于是之前的 4 种情况就变成 2 种了。

在这里插入图片描述

同前面扑克牌问题的计算方法类似,你患癌症的概率是 0.095% ÷ (0.095% + 1.998%)= 0.045(保留三位小数)。

从这个结果可知,在得知阳性这一检查结果的情况下,你罹患这种癌症的概率约为 4.5% ,这便是后验概率。

频率树的方法

还有一种方法值得介绍,就是频率树。假设总人口是 10 万人,根据各种情况,最后可以生成一棵树。

在这里插入图片描述
是不是这种方法更直观呢?

-----【End】-----

参考资料
小岛宽之.(2018).统计学关我什么事:生活中的极简统计学.北京时代华文书局.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值