关于区间预测在医学预测模型中应用的一点思考

区间预测在医学预测模型中的应用

  1. 什么是区间预测
    区间预测是指在给出确切预测值的同时,还提供预测值的可能范围,称为预测区间。与置信区间是不同的概念。区间预测主要用于结局是连续变量的情况,例如预测房价或股票价格。通过提供一个范围,区间预测帮助决策者更好地管理风险,制定合理的策略和计划。构建预测区间有五种方法,即经典方法、最短预测区间、分位数方法、最高密度区域和连续HDR。

  2. 区间预测在医学中的应用有限

  • 医学中常用的结局变量多为分类变量。对于结局变量是无序(多)分类变量,目前的结果呈现方式是给出具体的类别或给出类别的可能概率。在此基础上,再给出预测区间,对于辅助决策功能有限:首先,直接给出类别的情况下无需区间预测;其次,在给出预测概率的情况下,如果模型效能一般,预测区间也不够准确;如果模型效能较好,则可以选择直接给出预测概率。

  • 然而,当结局变量为有序多分类变量时,例如使用排名量表作为预后结局指标。最近接触的一个分析案例是将有序多分类结局转换为二分类变量,然后使用逻辑回归进行建模。这种情况下,如果采用区间预测可能是一种更好的预测结果的呈现形式,更加便于辅助决策。另外一种可能的使用情况是COX分析,这种分析形式以时间为主要预测对象,使用区间预测呈现出预测生存时间的范围,也是使用者非常容易接受和理解的预测结果呈现形式。

  1. 区间预测对模型区分度的要求高
    我们之前讨论过预测模型的结果呈现形式的区别。简要来说,直接预测类别的形式,对模型的效能要求较高,区分度是最重要的指标;而给出预测概率的形式对模型性能要求中等,但是要求概率分布符合实际的概率分布,所以校准度是对重要的指标,可以通过后概率校正和选择决策阈值等方式,使其在性能有限的情况下最大限度地发挥功能。而区间预测也是对模型效能要求较高,模型区分度应该是重点考察的指标,构建预测模型时,应尽可能提高模型的性能,以获得可靠的预测区间。

  2. Python和R中的实现

  • Python和R中都可以轻松实现区间预测。python实现大家可以了解MAPIE这个库,MAPIE是一个开源的Python库,兼容scikit-learn库中的所有模型,可以很方便地与其机器学习模型结合使用;
  • 而在R 语言中,tidypredict库(仅lm和glm)、RFpredInterval库(适用树形的机器学习模型)和probably库等都提供了一定形式的区间预测函数。
  • 以上只是略略的考察,有待于仔细的验证。

总结

区间预测,可以看作是另外一种模型预测结果的呈现形式,并不是新鲜事物,在python和R中都可以实现,需要讨论的是应用的场景。以上是一些个人的思考, 希望对大家有所助益,不当之处也请各位读者多指正。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

预测模型的开发与应用研究

文中代码请大家随意

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值