fprom预测结果内容_临床预测模型的局限性

临床预测模型的局限性

摘要:

临床预测模型是基于相关性而发挥预测作用的一种临床决策支持数学机器,而医学问题的解决往往更依赖于因果关系。本文从临床预测模型的构建过程本质,内容本质和其对科学理论发展的贡献,论述其固有的局限性,提出CPM应该更多的服务于解释医学问题而非简单的预测感兴趣医学变量,最后呼吁科学工作者勇于创新,跳出思维定式。

####### 什么是CPM #######

科学理论对于现实问题具有解释功能和预见功能,是人们认识世界和改造世界的有力武器【1】。临床预测模型(Clinical predictive model, CPM)是一类运用数理统计方法,根据大量已观察到的病人的特征以及其最终结局,构建一个理想化的数学模型描述这些特征与结局之间的关联,并用于未来遇到相似病人时可以根据其特征预测其结局,从而为临床决策提供依据。它一般基于观察性研究的结果而得出。

####### CPM的局限性 #######

1、CPM的构建过程本质上是一种归纳推理。它的构建过程相当于对大量具有一定特征的目标人群进行特征概括,构建描述所观察到的表象特征与临床特征之间关系的一个以数学方式表达的工具。通过在训练集内的多个病人的模型测试的较优结果以及在验证集样本中的结果复现,我们就武断地判定对所有相同临床背景,相同疾病群的病人,该模型能具有同等的预测效力。因此,通过归纳法得出的模型,必然具备归纳法的局限性:(1)它只能得出不充分可靠的结论。(2)它未必把握住事物的本质。(3)它在概括事物的共性时,把事物的属性看做为某种既成的、静态的东西,它所概括的是事物的过去,难以概括它的发展和未来。【2】在实践中,CPM并不是百分之百精确的,它告诉我们某些现实的同时,又包含了一些无法解释的部分,这个无法解释的部分究竟来自具有固有异质性的病人样本中的随机变异,还是来自某种未知的尚未发现的新的机制与作用?我们又该如何判断这种无法解释的部分是平平无奇的变异还是新颖的研究发现?目前并没有很好的解决办法。

2、CPM是一种建立在统计学相关性基础上的数学机器,其内容缺乏因果性。尽管大多数CPM的构建基于前瞻性队列研究,即观察自变量在前,而观察因变量在后,但它的内容可能包含也可能不包含因果关联。例如,临床医师希望通过一些常见的实验室化验数据,影像学资料和病史体征等预测患者的预后,并且根据已有的相关知识理论推测出可能的预测因子,并在研究设计时决定今后在病人中采集这些相应的数据。当临床医师基于已有实验论证的专业理论进行筛选可能的预测因子时,他已经在做出某种主观意义上的因果推断,但这种推断往往是对已有理论的延伸扩展,因而其内容有一部分是没有确凿的客观的实验依据的,因此其因果链是脆弱而不完善的。试问,假如存在具有很强预测能力,但丝毫没有任何因果解释能力的因素,这样的因素应不应该纳入模型中?会不会在实际应用层面被接受?

必须承认,单纯服务于预测作用的模型在实践中是可以在一定程度上忽视因果关联的。但现如今许多临床流行病学相关研究提出的观点实际上是用于改变医疗决策的,即与干预相关的。当我们需要干预时,我们实际上已经在默认文章的结论在描述因果关联而不是相关关联,因为只具有相关关联的两个事物,改变一事物是不会对另一事物起作用的,比如公鸡打鸣和太阳升起,你把鸡杀了第二天太阳还是照样升起,而如果你造了整个半球的行星发动机把地球推离了公转轨道,那么太阳才会再也不会升起。因此当研究单纯服务于预测时,相关即可。当研究服务于医疗干预时,必须有因果关联才行。而因果推断有其自身不同于相关性分析的原则,例如一个观察性研究要想能被看做一个随机对照试验,需要满足一致性(Consistency),可交换性(Exangeability)和正性(Positivity)(下图)【3】。其中可交换性的满足尤其重要;因果是单向性的,而相关是双向性的;因果推断常常需要根据专业领域知识绘制有向无环图,从因到果的路径以外常常有许多旁路途径,而这些旁路途径里同样流动着一定大小的相关性,这些不必要的相关性是我们需要努力在分析阶段甚至研究设计阶段就去阻断它们的,否则我们对因果效应的估计值将会存在系统偏差。当这些旁路途径上的相关性被阻断之后,我们对因和果之间的相关性分析才能近似等同于因果效应的估计。

c7ef6e588f274f9755058c4993e9305a.png

事实上,因果推断也并非易事,许多因果推断的模型建立在一些无法验证的假设基础上,甚至某些时候,通过观察性研究获取因果关联本身就是不可能的。正如我们日常经验中时常感受到的,有时候你找不到事情的原因,并不是你想得到的东西出了错,而是真正的原因实际上常常超出了我们个人的认知范围,是你根本想不到的东西出了问题,所以不管你怎么想都只是在用错误产生错误罢了。

虽然这么说有些悲观,但传统的流行病学因果推断的依据:时间先后顺序,关联的强度,关联的可重复性,关联的剂量反应关系,生物学合理性,终止效应。对于观察性研究,先后顺序、关联强度和剂量反应关系还好说,可重复性一般体现在多中心或者多个地区不同人群的研究结果的复现,生物学合理性纯粹看个人口才;终止效应,如果是我能检验的,这研究就不是观察性研究了。所以对于观察性研究,6个标准里能理直气壮的回答的只有3个,其余3个就只能交给后继之人。

3、CPM对科学理论发展的贡献有限。科学研究的基本作用是发展科学理论,提出和解决新的实际问题。从对立统一的角度来看,CPM产生了新知识,因为它提供了一个新的适用于特定情境的工具;CPM也没有产生新知识,因为模型的构建需要先验地确定研究者感兴趣的自变量集,而一个自变量之所以会在研究设计阶段被纳入,就是因为这一变量与待预测变量之间可能存在因果关联,所以就像演绎推理一样,一个新的CPM只是对原有知识进行了一种变换,将其表浅的生物学现象以数学映射的形式表现了出来,而这里涉及的生物学机制可能也并不是直接导致其结果的原因。这样的研究对科学进步的作用是值得怀疑和考量的。爱因斯坦曾指出:“提出一个问题往往比解决一个问题更重要。因为……提出新的问题,新的可能性,从新的角度去看待旧的问题,却需要有创造性的想象力,而且标志着科学的真正进步。”【4】 从这个角度上来看,CPM的构建通常不涉及提出新的科学问题,而只是机械地完成一个既定的目标,即在时间上先于结局事件的发生而给出预测结果,以模型指标的量变引起结局判定、实施不同决策的质变为基本蓝图,唯一不同的是其应用的临床背景。因此,单一的针对CPM的研究具有一种固有的落后性,缺乏创新性。未来有关CPM的研究应该更多的服务于解释医学问题,而非简单的预测可能结果。

####### 创新思维的重要性 #######

当下医学界正存在着某种批量生产CPM的学术潮流,这是值得批判和引人深思的。这种所谓的通过归纳得出的数学关联,本质上可能是空洞无物的、毫无逻辑可言的,不应该也不能应用于临床医学。应该承认的是,CPM具有其一定的功能价值,但同时要看到其自身蕴含脆弱的因果链和缺乏实验基础证据的事实。CPM的泛滥一定程度上折射出当今逐渐偏向功利主义的学术氛围。更进一步的,当大量的研究人员将人力、物力和财力置于这种所谓的研究上时,解决真正有意义有价值的医学问题的力量将减少,这最终将使人类医药卫生事业的发展减速。因此学术探索的矛头不应只是换汤不换药,当科学的先驱者提出一个前所未有的新方法时,后继之人常常将这一方法原封不动地予以四处套用,而后陷于思维定式之中。历史已经多次证明,不遗余力地使自己具备并施展创新思维和创造力,这一理念是科学界保持活力一以贯之的圭臬。

参考文献

【1】刘大椿 自然辩证法概论(第2版) 中国人民大学出版社,2008

【2】归纳法 MBA智库百科

https://wiki.mbalib.com/wiki/%E5%BD%92%E7%BA%B3%E6%B3%95

【3】Hernán MA, Robins JM (2020). Causal Inference: What If. Boca Raton: Chapman & Hall/CRC 

【4】爱因斯坦,英费尔德《物理学的进化》 上海出版社,1962

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值