如何快速绘制logistic回归预测模型的DCA曲线?

临床预测模型,也是临床统计分析的一个大类,除了前期构建模型,还要对模型的预测能力、区分度、校准度、临床获益等方面展开评价,确保模型是有效的!

区分度即通过ROC曲线表现,校准度通过校准曲线表现,但这两个指标无法为临床决策提供参考,在这种情况下,决策曲线分析(DCA)就显得很有意义了。

决策曲线分析(DCA)是一种评估预测模型在实际临床决策中应用价值的方法。它通过比较不同决策方案(如对所有人进行治疗或对谁都不进行治疗)在特定阈值范围内的净收益来实现。这里的“净收益”是指考虑到假阳性和假阴性的结果所带来的益处和损失后的净效果。

有关DCA结果的具体解读方法,大家可以参考下方的图片笔记。

2e03889d9bc8fde7de9200122346c469.png

来源:CSDN@xzxg001

理论知识比较好理解,只是在实际分析中,想要绘制出精美的DCA曲线,还要花一番功夫,像是常见的R语言软件就需要大量参数进行调整,并且训练集和验证集图像还需要分开绘制两遍......

因此,这里为大家推荐一个统计分析小工具——风暴统计,可以超快速绘制完成临床预测模型的DCA曲线,一次性给出训练集与验证集的图像!

风暴统计是由浙江中医药大学的郑卫军教授基于R语言开发的,不仅结果准确性有保障,并且全部实现菜单化操作,统计小白也可以轻松上手,绘制精美的ROC曲线!

下面我们就结合一份实操数据来为大家详细介绍一下具体的操作步骤吧!

百度、必应Bing搜索“风暴统计”

本平台上线的所有工具都是免费的

ba7ba662da24e837b56dec5fa8c624c5.png

1、进入风暴统计平台

首先,浏览器搜索风暴统计,依次点击"风暴智能统计"——"临床预测模型"——"logistic临床预测模型"!进入分析界面后,根据提示,完成数据的导入与整理。

这里我们不再赘述数据的导入与整理过程,详细教程大家可以点击下方链接:

详细指南!风暴统计如何高效导入数据,统计分析快人一步?

详细版!如何利用风暴统计进行数据的整、转换?

bacc5cebca64f555de507aca0023c829.png

2、数据集拆分

预测模型都需要内部验证,内部验证的方法有随即拆分、交叉验证、Boostrap等。但风暴统计平台目前仅能做随即拆分法内部验证。

随机拆分法内部验证,顾名思义就是将原始数据集按照7:3(常见)或者6:4等比例进行拆分,一部分用于建模,另外一部分用于验证模型。

ad5a1a7f448293a00b1f2077038577b0.png

风暴统计支持两种拆分方式:随机拆分法、导入已拆分好的数据。

  • 如果选择“随机拆分”,需要设置随机种子拆分比例。随机种子对于数字位数没有要求,作用是可以保证拆分数据的分析结果可以复现,平台默认是1234,拆分比例更好理解,只需要拖动滑条,蓝色部分就是训练集的数据占总数据的比例。

c98b0a54565a9bc5f42796c2d6a25a44.png

  • 如果选择“导入已拆分好的数据”,需要设置事先在导入的数据集中增加一列用于区分训练集和验证集的变量,比如新增列叫"group",通过编码赋值1代表训练集,2代表验证集。那么第一步:选入区分训练集与验证集的变量,第二步:勾选代表训练集的编码值!

注:“导入已拆分好的数据”不仅可以做内部验证,更重要还可以用来做外部验证哦!同样需要一列变量来区分训练集和外部验证集!

53078c3219b8067efb67613889263199.png

3、构建预测模型

完成数据记得拆分后,我们就可以开始构建预测模型啦!请注意,预测模型的构建仅在训练集开展哦!

预测模型的本质,简单来说,也就是多因素回归模型!多因素回归听上去是不是平易近人许多?风暴统计可以超快速完成这一步!

首先,选择模型变量——因变量自变量。因变量必须是以0和1赋值的哦!自变量就可以放入我们数据中所有可能的预测因子!

0c93e87f44ec13df603ff9d8ae194a20.png

接着,定义模型自变量筛选的方式,满足筛选条件的自变量会进入多因素回归模型!

注:多因素模型中的所有变量就是我们最终预测模型中全部的预测因子了,并不只是多因素中有意义的变量哦!如果希望预测模型中的变量P值均小于0.05,可以选择逐步回归分析中"根据P<0.05筛选"的选项!

ef2f4d4d566f1c0f5ab11b646d4b6717.png

自变量筛选方式也有3种:

  • 基于分组差异性结果

  • 基于单因素回归结果

  • 自定义

前两个比较相似,区别就在是根据差异性P值还是单因素P值进行筛选!

如果选择了"基于分组差异性"或"基于单因素回归",只需要完成2步设置。

第一步,P阈值的选择,如果自变量个数过少,可以适当放宽标准,0.1、0.2也都是可以的。当选择不限制时,单因素的全部自变量都将纳入多因素回归分析。

第二步,是否开展逐步回归,选择“否”,就是我们常见的先单后多分析,另外逐步回归方法,平台也提供了多种选择:双向逐步回归,向前逐步回归,向后逐步回归以及考虑到有时P值大于0.05的变量在逐步回归时也会留在模型中,新增了根据P<0.05的原则开展逐步回归!大家可以根据研究需要自行选择。

7b52abda09272af22b16459b959b2de7.png

5f12f5d60685be3cafdc2a67fe7caea8.png

如果选择了自定义筛选自变量,比如实际研究中,预测因子的筛选也需要结合专业知识以及相关文献进行判断,纯数据驱动也不太好。假如变量A在临床中是十分重要的变量,但是受限于样本原因,单因素与差异性均没有统计学意义,这时候,我们可以自定义挑选预测因子,选择我们预期的预测因子,自行选择是否需要逐步回归!也是一条途径!

78fc5c5937f9bbfa62f06073509c83ad.png

选择完毕后,我们就得到了多因素回归的结果,现在多因素模型也就是我们最终的预测模型,列线图中会包含多因素回归中的全部变量!

5484b831dde1d19951000e7198e33212.png

完成预测模型的构建后,就可以同步给出模型得到验证结果啦!

4、决策曲线

点击"DCA曲线"模块,结果也同时输出,包括有训练集DCA曲线、验证集DCA曲线

d8151a43e532e9b1dfc4bd71849a25f4.png

提供了R语言2个常见包的绘图结果,并且都提供了原生态、优化版,大家可以参考下方例图,选择自己喜欢的风格。

8c9f0a9e72e76a0e6ec436d58eee6956.png

f2141f565c68745d88a125e9dd371583.png

2d06d3c5907856a43bf0d94e3958e4d4.png

a05b731dcf709f44d417674a11aaac87.png

平台还支持对曲线是否平滑,进行处理,可以通过下方例图,比较具体差别,可以看到,非平滑处理的曲线会更加的崎岖,也是提供大家更多样的选择!

92cc72994b006f374191d09d4eef2fe5.png

ced53046cc50f4df767badd941fe73cf.png

1dddadb48177b2e4b5fe5553ff435999.png

最重要的是,平台将R语言复杂的参数全部简化为了菜单式选项,可以个性化调整曲线的颜色(model、ALL线、None线)、粗细线条类型等,还可以对图例/坐标轴的字体大小位置进行调整。

请注意!这里的颜色与坐标轴和标签修改设置仅对“优化后”曲线有效,对原生态曲线是无效的。

ed31e780ad75dd311fa4af312069dc04.png

5337b5e6ba1095e4b4b6b007b82bff5a.png

5、下载结果

最后在曲线下载设置中,选择下载图片(训练集还是验证集、原生态还是优化后),保存类型(支持pdf、jpeg、png、tiff),曲线页面,中文字体。

如果需要在图片中添加中文字符,建议下载PDF进行二次编辑,再另存为图片!

选择完毕后,就可以下载DCA曲线啦!

48d1b0ff05b8c92a2b2f579725552b2f.png

下载下来的图片也十分清晰!

54e39aaec01c74cfb738af2ea3059a1b.png

以上就是风暴统计平台绘制DCA曲线的全部操作流程啦!如果您在使用过程中出现报错,可以参考下方推文,排查一下问题所在哦!

答疑 | 风暴统计更换服务器后,为什么总出现同样的报错?


详情请点击下方:

2024年临床预测模型培训班6.29-30,无代码构建预测模型

  • 7
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值