​临床预测模型构建之 —— 模型性能评估

​临床预测模型构建之 —— 模型性能评估

Jimmy Nursing Studies Hub 2024-05-09 22:15

临床预测模型的基本步骤

临床预测模型的开发步骤主要包括以下几个步骤
1.数据收集
2.模型构建
3.模型性能评估
4.模型验证
5.模型的呈现与后期维护

模型性能评估

临床预测模型的性能评估包括整体性能、区分 度、校准、重分类和临床有用性5个方面。

一、整体性能评估

模型整体性能是评估预测模型在数据集上的拟合程度或预测能力的指标,常用的评估指标包括:
R2(R-squared)是一种用于评估回归模型拟合优度的统计量。它表示因变量的方差中能被自变量解释的比例,取值范围从0到1。R2越接近1,说明模型拟合得越好。

布里尔评分(Brier score)用于评估分类模型的预测精度。它是观察到的类别和预测类别之间的均方误差,取值范围从0到1,0表示完美的预测,1表示最差的预测。通常,布里尔评分越低,模型的性能越好。

AUC(Area Under the ROC Curve)是一种常用的评估分类模型性能的指标。ROC曲线是一种以真正例率(True Positive Rate,TPR)为纵轴,假正例率(False Positive Rate,FPR)为横轴的曲线,用于描述模型在不同阈值下的分类性能。AUC即ROC曲线下的面积,其取值范围通常在0到1之间,表示模型分类性能的优劣程度。

F1分数,是一种常用的用于衡量二分类模型性能的指标,它综合考虑了模型的精确率(Precision)和召回率(Recall)。F1分数的取值范围在0到1之间,值越接近1表示模型性能越好。

二、模型区分度

区分度指模型在预测事件与非事件之间进行区分的能力。常用的区分能力指标包括 C统计量,C统计量表示模型对于随机选择一对事件和非事件的患者,正确判断哪个风险更高的能力,C统计量在0.5~1之间,较高的值表示较好的区分能力,接近0.5表示区分度较低,越接近1表示模型越理想。

三、模型校准度 

校准度或拟合优度指模型预测值与实际观察值之间的一致性。常用的校准度指标包 括大规模校准、校准斜率和Hosmer-Lemeshow统计量。大规模校准关注整体的校准情况,校准斜率则表示模型的预测风险与实际观察风险之间的比 例关系,而Hosmer-Lemeshow统计量用于评估模 型的整体校准程度。

大规模校准(Large-scale Calibration):大规模校准用于评估模型在整个数据集上的校准性能。它通过将样本分成多个子组,并计算每个子组内实际事件发生率与模型预测概率的平均值之间的差异来评估模型的校准程度。

校准斜率(Calibration Slope):校准斜率衡量了模型预测概率与实际观察概率之间的线性关系。通过拟合一个线性模型来估计校准斜率,该线性模型的预测变量是模型的预测概率,因变量是实际观察概率。校准斜率为1表示模型的预测完美地匹配了实际观察概率。

Hosmer-Lemeshow统计量:Hosmer-Lemeshow统计量是一种比较模型预测概率与实际观察概率之间的差异的方法。它将样本分成多个组,并计算每个组内的预测概率与实际观察概率之间的差异的平方和,然后将这些差异合并成一个总体统计量。较小的Hosmer-Lemeshow统计量值表示模型的校准性能较好。

四、重分类

重分类用于新旧预测模型比较并衡 量模型的改进和增益,常见的重分类统计指标如净重新分类指数(net reclassification index,NRI)和综合判别改善指数(integrated discrimination improvement,IDI)

净重新分类指数(NRI):NRI衡量了新模型相对于基准模型在预测中的净重新分类。它通过计算在新模型中正确重新分类的人数减去在基准模型中正确重新分类的人数,然后将这个差异标准化,以提供一个在-2到+2之间的指标。NRI为正值表示新模型的预测能力优于基准模型,为负值表示预测能力劣于基准模型。

综合判别改善指数(IDI):IDI衡量了新模型相对于基准模型在平均预测概率上的改善程度。它通过计算在新模型中平均预测概率上的改善与在基准模型中的平均预测概率上的改善之间的差异来评估。IDI的值为正表示新模型的预测能力相对于基准模型有所改善,为负值表示预测能力没有改善。

五、临床效益

临床效益与临床实践密切相关, 它通过确定阈值、评估净收益和制定决策规则来评估预测模型的实用性和经济效益。通过分析决策曲线 (decision curve analysis,DCA)评估预测模型在实际决策中的效果并确定最佳的决策阈值。

阅读 6647

Nursing Studies Hub

已关注

分享收藏2516

关注此账号的人还喜欢

临床预测模型:模型比较1

我关注的号

木天琳neuron

不喜欢

不看的原因

确定

  • 内容低质
  • 不看此公众号内容

Diffusion 扩散模型从“画小姐姐”到勾勒生物分子结构|DP小课堂

1个朋友分享

深势科技 DP Technology

不喜欢

不看的原因

确定

  • 内容低质
  • 不看此公众号内容

清华大学优秀本科毕业论文全文欣赏

19个朋友读过

学位与写作

不喜欢

不看的原因

确定

  • 内容低质
  • 不看此公众号内容

写下你的留言

人划线

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI生成曾小健

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值