统计推断(频率,似然,贝叶斯)

医院有一台诊断疾病仪器,用于检查和诊断某疾病。如下表所示,已知患病情况下该仪器检测结果呈现阳性的概率是0.95,阴性结果概率是0.05;未患病情况下该仪器检测结果呈现阴性的概率为0.98,阳性结果概率为0.02。
在这里插入图片描述
假设某人甲,因身体不舒服去医院做检查,检查报告显示结果是阳性。医生根据阳性结果能得出以下结论:

1.某人甲可能并没有患病。
2.某人甲应该接受治疗。
3.这次检测结果是某人甲患病的证据。

结论1是否正确呢? 这个问题中,已知患有疾病或者未患有疾病时检测结果呈现阳性或者阴性的概率, 但是检测结果呈现阳性或者阴性时患有疾病或者未还有疾病的概率是未知的。

已知概率:
P(阳性 | 有病)=0.95, P(阴性 | 有病)=0.05, 两者加和为1


P(阳性 | 无病)=0.02, P(阴性 | 无病)=0.98, 两者加和为1

未知概率:
P (有病 | 阳性) ,P (无病 | 阳性) , P (有病 | 阴性) , P (无病 | 阴性)
在医院使用的诊断仪器属于已上市医疗器械设备,是经过国家药监局注册申请并做临床试验批准通过后才在医院进行诊断使用的;经过注册试验批准的仪器事在临床试验中已经验证过该仪器和金标准之间的检测一致性并且对检测结果呈现阳性或者阴性时患有疾病或者未还有疾病的概率有了一定了解,并不是完全未知。在这个问题中,假设这几个概率是未知的。

1.问题1的核心是:检测结果为阳性的情况下,某人甲未患癌症的概率是多少?

利用贝叶斯公式,可得

P (无病 | 阳性) = P (阳性 | 无病) * P(无病)
/ (P (阳性 | 无病) * P(无病) + (P (阳性 | 有病) * P(有病) )

假如该病是罕见病,例如患病的先验概率为0.001, 则P (无病 | 阳性)=0.955; 假如该病不是罕见病,例如患病的先验概率为0.2, 则P (无病 | 阳性)=0.08。

结论1的正确与否取决于该疾病是否是罕见病,即该疾病先验概率的大小。该病在人群中的概率越高,检测结果为阳性时,甲患病概率越高。反之,该病在人群中的概率越低,检测结果为阳性时,甲结果为阳性时,不一定患病。

  1. 问题二的核心是:是否接受治疗?

假设1:甲未患病
假设2:甲患病

基于NP(Neyman~Pearson)假设检验方法,P(阳性或者更极端的结果 | 假设1)= P(阳性 | 无病) = 0.02, 假设一类错误设定为0.05,此时P值小于0.05,表明数据和假设1不兼容,间接证明假设2成立。但是假设2成立也不是绝对的。从长远来看,如果做100次这样的决策,5次是错误的,95次是正确的,这个决策从长远来看是靠谱的。如果接受治疗的药物疗效很好,副作用很小或者基本上没有副作用,甲采取治疗是明智的选择。如果治疗的药物副作用很大,即使患病也可以自愈,甲采取治疗就不太明智了。从决策的角度看,要判断“甲患病却判断他没患病因而没有给予治疗”的后果更严重还是“甲实际未患病却判断他患病从而给予治疗”的后果更严重。基于此,分别赋予一类错误和二类错误相应的界值,譬如药物临床试验中通常把一类和二类错误分别设定为0.05和0.2,来控制做决策时犯这两类错误的概率。

3.问题三的核心是:单看这次阳性结果,在多大程度上表明甲患病?

问题三无需考虑疾病的先验概率,也不必考虑采取什么措施和相应的后果。单纯针对阳性结果数据,甲在多大程度上可能患病。此时需要用到科学哲学家Ian Hacking在1965年提出的似然法则:

Law of Likelihood: If hypothesis A implies that the probability that a random variable X takes the value x is PA(x), while hypothesis B implies that the probability is PB(x), then the observation X=x is evidence supporting A over B if and only if PA(x)>PB(x), and the likelihood ratio, PA(x)/PB(x), measures the strength of that evidence.

根据似然法则,P患病(阳性)/P未患病(阳性)=0.95/0.02=47.5,47.5是似然比,这个比值超过了10,是甲患病的强有力证据。

上述三个问题背后的理论和方法代表了统计推断的三个学派:贝叶斯学派、频率学派以及似然学派。只有贝叶斯方法可以得到基于数据结果患病概率,频率学派NP方法得到的是基于H0假设成立前提下当前数据结果以及更极端结果的概率,似然学派的方法得到的是似然比。下表是心理学家、统计学家Zoltan Dienes在《Understanding psychology as a science》中总结的统计推断三大学派特点,结合本文的例子可以看出:

表2 统计推断的三大学派
在这里插入图片描述A. 如问题2所示,NP方法旨在提供一个非黑即白的决策,在这个决策过程中事先设定固定值控制Long-run的一类和二类错误。假设抽样100次,其中有5次阳性错误结果,那么总体上把一类错误控制在5%的水平。从控制错误的角度来讲,这是药监管机构喜欢的决策方式; 决策对错不必害怕,一次决策要么对要么错,从长期来看,把这个错误控制在了一定水平下。NP有两个缺点:第一是NP求的是基于假设得到当前结果或者更极端的结果的概率,这个更极端的结果并不是当前结果而是假想的结果,事实上决策所根据的证据超越了当前数据所包含的信息;第二是NP对停止规则很敏感,如下图所示:针对同样的数据不同的停止规则(比如,有期中分析还是没有期中分析)得到的结果可能截然不同。这两个缺点也是饱受遵循似然原则的贝叶斯学派和似然学派批评和质疑。
在这里插入图片描述
B. 如问题1所示,贝叶斯方法旨在提供一个基于当前数据的假设1和假设2成立的概率。贝叶斯方法是唯一一个可以得到基于数据下患病概率的方法,也是唯一一个同时遵循概率原则和似然原则的方法。 贝叶斯最饱受质疑的一点是:它受先验概率的影响。正如上面的例子,到底是考虑先验概率还是不考虑。两者都有道理。一方面,只有当前的数据结果才是有用的,之前的信息并不是这次检查的信息,按照NP和Likelihood的看法不应该被纳入进来做推断和决策。另一方面,从科学不断积累的角度讲,先验信息也是非常有用的,不能孤立的看待一次结果,因而需要把先验信息和当前数据结合起来做科学推断。

C.似然学派给出了关于证据强度的测量指标,既没有像NP方法那样用了假想的超越了数据包含的信息,也没有像贝叶斯那样受制于先验概率的影响。似然方法是唯一一个只用了当前数据信息做推断的方法。似然学派求出基于不同假设得到的当前数据结果的似然比,作为推断不同假设的证据。跟一类错误和二类错误控制相似的是,似然学派控制弱证据/误导证据的概率。似然学派里的弱证据/误导证据的概率跟一类错误概率完全不同。一类错误概率是被控制到一个固定的水平,但是弱证据/误导证据的概率随着试验的人数不断增多会趋近于0。贝叶斯学派本来没有控制一类和二类错误的方法,但是FDA要求药厂在使用贝叶斯方法时评估其一类错误,由此贝叶斯学派里也发展出了相应的一类错误方法。 贝叶斯学派总是强调,随着数据信息的增多,似然会把先验信息的影响给稀释掉,既然如此,为什么不直接采用似然学派的方法呢?因此,目前除了NP和贝叶斯学派以外,有一部分应用者和统计学家坚信似然学派是唯一可以刻画证据强度的方法,最适用于统计推断。

伟大的统计学家Richard Royall关于上述三个问题的给出了代表三个学派的清晰表述:

1.What do I believe, now that I have this observation? (Bayes)

2.What should I do, now that I have this observation? (NP)

3.What does this observation tell me about A versus B? (How should I interpret this observation as evidence regarding A versus B? How should I treat the data as evidence for one theory rather than another?) (Likelihood)

更多关于三大统计推断学派的内容,请参考下面三本书:

1.Richard M. Royall. Statistical Evidence: A likelihood paradigm. 2007

2.Zoltan Dienes. Understand psychology as a science: an introduction to scientific and statistical inference. 2008.

3.Deborah G. Mayo. Statistical inference as severe testing: how to get beyond the statistics wars. 2019.

原文请参考链接:三大统计推断派系 - 频率学派、似然学派、贝叶斯学派

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值