从概率论角度解释COVID-19的检测为什么一般是两次

经典的概率论问题(二)稀有疾病的检测

本系列是博主为了督促自己在博士期间能够静下心来完成科研开设,并将我在学习期间学到的知识通过自己的语言讲解出来,如果能帮到你那么再好不过。

前言

COVID-19已经被发现了半年之久,并且其深深影响了人们的生活习惯和生活方式。

在疫情前期,大家都非常在意确诊人数、疑似人数这些数字的变化,在关注重点从国内转移到国外时,国外的确诊人数呈指数型上升,最明显的是美国,连续多日新增确诊人数上万,英国在宣布放弃群体免疫策略之后确诊人数也是大幅上升,日本在宣布奥运会延期后其确诊人数也在短期出现了一定幅度的上涨,而某东方大国——印度的确诊人数曾经迟迟上不去,但是以印度人的人口密度、生活方式等,大家都很清楚其实际确诊人数一定远远不止已确诊人数。当然曾经国内疫情高峰期使也出现过湖北省确诊人数激增的情况,影响确诊和疑似人数的因素一方面原因是实际感染人数,而另一方面便是国家对新冠患者的检测能力,在一个月前我们听到过川建国在答记者问时说过“我们的检测能力远远超过韩国”正是为了说明为什么美国的确诊人数爆炸式增长。

但是疫情的检测远远不止想象的简单,如今国内本土病例已趋近于无,大都是由境外输入引起的,但是境外输入病例是没办法杜绝的,试剂盒的检测能力是一方面,其中也蕴含着概率论的知识。

例题介绍及解答

  1. 有一种疾病的发病率是1%,即其影响了该地区百分之一的人口。张三到医院做了一次疾病检测,结果显示是阳性,可以知道的是该检测的准确度为95%。试问张三在检测为阳性的情况下确诊的概率是多少?
    解:
    让我们假设事件D为张三确诊患病,事件T为张三检测为阳性。
    则我们可以得到 P ( T ∣ D ) = P ( T ˉ ∣ D ˉ ) = 0.95 , P ( T ∣ D ˉ = 0.05 ) P(T|D)=P(\bar{T}|\bar{D})=0.95,P(T|\bar{D}=0.05) P(TD)=P(TˉDˉ)=0.95,P(TDˉ=0.05),即张三在确诊时检测出阳性概率为0.95,未患病时检测出阳性概率为0.05,而我们要求的结果是 P ( D ∣ T ) P(D|T) P(DT),根据贝叶斯公式及LOTP(Law of Total Probability)可得
    P ( D ∣ T ) = P ( T ∣ D ) P ( D ) P ( T ) = P ( T ∣ D ) P ( D ) P ( T ∣ D ) P ( D ) + P ( T ∣ D ˉ ) P ( D ˉ ) P(D|T)=\frac{P(T|D)P(D)}{P(T)}=\frac{P(T|D)P(D)}{P(T|D)P(D)+P(T|\bar{D})P(\bar{D})} P(DT)=P(T)P(TD)P(D)=P(TD)P(D)+P(TDˉ)P(Dˉ)P(TD)P(D)
    P ( D ∣ T ) = 0.95 ⋅ 0.01 0.95 ⋅ 0.01 + 0.05 ⋅ 0.99 ≈ 0.16 P(D|T)=\frac{0.95\cdot 0.01}{0.95\cdot 0.01+0.05\cdot 0.99}\approx0.16 P(DT)=0.950.01+0.050.990.950.010.16
    Amazing有没有。即使有95%的检测准确度以及一次检测出阳性,张三实际患病的概率依然只有0.16,而没患病的概率为0.84。
    同理,当张三检测为阴性时,用相同的方法计算得到其实际患病的概率为0.00053.因此一次检测为阴性的结果更为可信。

  2. 接题目1,张三拿到阳性结果后,医院通知他三天后再次到医院进行检测,张三第二次检测的结果还是阳性。可知,两次检测是互相独立、互不影响的,试问张三在两次都检测为阳性的情况下确诊的概率是多少?
    解:
    首先假设事件D为张三确诊患病, T 1 T_1 T1表示第一次检测是阳性, T 2 T_2 T2表示第二次检测是阳性。第1题我们求得的结果实际为 P ( D ∣ T 1 ) P(D|T_1) P(DT1),而此题中我们需要得到的是 P ( D ∣ T 1 ⋂ T 2 ) P(D|T_1\bigcap T_2) P(DT1T2)
    由odd forms的贝叶斯公式我们可以得到
    P ( D ∣ T 1 ⋂ T 2 ) P ( D ˉ ∣ T 1 ⋂ T 2 ) = P ( T 1 ⋂ T 2 ∣ D ) P ( T 1 ⋂ T 2 ∣ D ˉ ) P ( D ) P ( D ˉ ) = 1 99 ⋅ 0.9 5 2 0.0 5 2 ≈ 3.646 \frac{P(D|T_1\bigcap T_2)}{P(\bar{D}|T_1\bigcap T_2)}=\frac{P(T_1\bigcap T_2|D)}{P(T_1\bigcap T_2|\bar{D})}\frac{P(D)}{P(\bar{D})}=\frac{1}{99}\cdot \frac{0.95^2}{0.05^2}\approx3.646 P(DˉT1T2)P(DT1T2)=P(T1T2Dˉ)P(T1T2D)P(Dˉ)P(D)=9910.0520.9523.646
    P ( D ˉ ∣ T 1 ⋂ T 2 ) = 1 − P ( D ∣ T 1 ⋂ T 2 ) P(\bar{D}|T_1\bigcap T_2)=1-P(D|T_1\bigcap T_2) P(DˉT1T2)=1P(DT1T2),代入上式左侧,可计算得到 P ( D ∣ T 1 ⋂ T 2 ) ≈ 0.78 P(D|T_1\bigcap T_2)\approx0.78 P(DT1T2)0.78
    即在两次检测均为阳性的情况下,张三确诊的概率从0.16跳变为0.78,其结果精确度更高。同时假设一次检测阳性、一次检测阴性,用同样的方法计算出其患病的概率大概为0.01。大家有兴趣可以用同样的方法计算出更多情况下的可能性,此处笔者不再赘述。

后记

或许上题中大家不相信检测一次就算查出来阳性,其实际患病可能性也只有0.16,但是大家忽略了该概率是后验概率,即其条件是该病的发病率是1%,只影响了百分之一的人口,如果发病率更高,那么结果肯定会更准确。
从这个问题大家应该就能感受出检测COVID-19的难度,希望大家能够继续坚持,相信不久疫苗就能投入使用,彻底从新冠病毒的影响中解放出来。

写文章不易,如果您觉得有用,还请点赞收藏关注哦,您的支持是博主最大的动力!

博主系上海交通大学2019届本科毕业生,2019/07-2020/06期间从事机器人SLAM工作一年,并将于2020/09到新加坡读取博士学位。
如果大家发现文章有漏洞或者错误,欢迎评论、私信博主,我将虚心接受建议,同时欢迎点赞关注。

评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

RedGlass_lee

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值