某医生用一种检测技术诊断就诊者是否患肝癌,他需针对已得知的检测结果做出判断:就诊者是否患病?
分析:实验结果无非是如下四种情况:
记 A={检测结果显示就诊者患有肝癌},B={就诊者确实患有肝癌},我们已得到以下概率数据:
- P(B)=0.0004(患者在人群占比很低)
- P(A|B)=0.95(对肝癌患者的检测准确率很高)
- P(A非|B非)=0.9(对非肝癌患者的检测准确率也很高)
用贝叶斯公式计算出某人被该方法检测为肝癌,而确实患有肝癌的概率:
应用这种检测准确率很高的检查方法,诊断就诊者确实患病的概率竟不到 0.4%!如何认知这个事后概率?若医生根据此事后概率值,断言一名检测结果显示患病的就诊者实际患病的可能性极低,你能接受吗?这样的解释合理吗?
可以注意到贝叶斯计算式中事件 B={就诊者确实患有肝癌} 发生的概率值 P(B) 极低,仅为10^(-4),致使计算出的概率 P(B|A) 很小。实际上,取“患者在人群中占比”作为事件B的概率是不合理的,因为就诊者往往是有一些征兆才会到医院寻诊,其患病的可能性应远超一般人群。
用贝叶斯公式计算事后概率,必须用到事前概率。一般情况下,在进行试验前不清楚各事前概率P(B)取何值。假阳性问题中若主观假定事前概率 P(B)=0.5,并代入贝叶斯公式可得到:
诊断患病而且实际患病的概率得以大幅提高!从数值计算来看,将事件B发生的概率由0.0004修改为0.5,凸显了肝癌患者的检测准确率因素。
下表有助于理解贝叶斯公式: