如何快速绘制logistic回归预测模型的DCA曲线？

风暴统计

已于 2024-06-26 15:32:46 修改

阅读量820

点赞数 7

文章标签：回归数据挖掘人工智能机器学习算法

于 2024-06-24 17:39:52 首次发布

本文链接：https://blog.csdn.net/fengbaotongji/article/details/139943478

版权

临床预测模型，也是临床统计分析的一个大类，除了前期构建模型，还要对模型的预测能力、区分度、校准度、临床获益等方面展开评价，确保模型是有效的！

区分度即通过ROC曲线表现，校准度通过校准曲线表现，但这两个指标无法为临床决策提供参考，在这种情况下，决策曲线分析（DCA）就显得很有意义了。

决策曲线分析（DCA）是一种评估预测模型在实际临床决策中应用价值的方法。它通过比较不同决策方案（如对所有人进行治疗或对谁都不进行治疗）在特定阈值范围内的净收益来实现。这里的“净收益”是指考虑到假阳性和假阴性的结果所带来的益处和损失后的净效果。

有关DCA结果的具体解读方法，大家可以参考下方的图片笔记。

来源：CSDN@xzxg001

理论知识比较好理解，只是在实际分析中，想要绘制出精美的DCA曲线，还要花一番功夫，像是常见的R语言软件就需要大量参数进行调整，并且训练集和验证集图像还需要分开绘制两遍......

因此，这里为大家推荐一个统计分析小工具——风暴统计，可以超快速绘制完成临床预测模型的DCA曲线，一次性给出训练集与验证集的图像！

风暴统计是由浙江中医药大学的郑卫军教授基于R语言开发的，不仅结果准确性有保障，并且全部实现菜单化操作，统计小白也可以轻松上手，绘制精美的ROC曲线！

下面我们就结合一份实操数据来为大家详细介绍一下具体的操作步骤吧！

百度、必应Bing搜索“风暴统计”

本平台上线的所有工具都是免费的

1、进入风暴统计平台

首先，浏览器搜索风暴统计，依次点击"风暴智能统计"——"临床预测模型"——"logistic临床预测模型"！进入分析界面后，根据提示，完成数据的导入与整理。

这里我们不再赘述数据的导入与整理过程，详细教程大家可以点击下方链接：

详细指南！风暴统计如何高效导入数据，统计分析快人一步？

详细版！如何利用风暴统计进行数据的整、转换？

2、数据集拆分

预测模型都需要内部验证，内部验证的方法有随即拆分、交叉验证、Boostrap等。但风暴统计平台目前仅能做随即拆分法内部验证。

随机拆分法内部验证，顾名思义就是将原始数据集按照7：3（常见）或者6：4等比例进行拆分，一部分用于建模，另外一部分用于验证模型。

风暴统计支持两种拆分方式：随机拆分法、导入已拆分好的数据。

如果选择“随机拆分”，需要设置随机种子和拆分比例。随机种子对于数字位数没有要求，作用是可以保证拆分数据的分析结果可以复现，平台默认是1234，拆分比例更好理解，只需要拖动滑条，蓝色部分就是训练集的数据占总数据的比例。

如果选择“导入已拆分好的数据”，需要设置事先在导入的数据集中增加一列用于区分训练集和验证集的变量，比如新增列叫"group"，通过编码赋值1代表训练集，2代表验证集。那么第一步：选入区分训练集与验证集的变量，第二步：勾选代表训练集的编码值！

注：“导入已拆分好的数据”不仅可以做内部验证，更重要还可以用来做外部验证哦！同样需要一列变量来区分训练集和外部验证集！

3、构建预测模型

完成数据记得拆分后，我们就可以开始构建预测模型啦！请注意，预测模型的构建仅在训练集开展哦！

预测模型的本质，简单来说，也就是多因素回归模型！多因素回归听上去是不是平易近人许多？风暴统计可以超快速完成这一步！

首先，选择模型变量——因变量、自变量。因变量必须是以0和1赋值的哦！自变量就可以放入我们数据中所有可能的预测因子！

接着，定义模型自变量筛选的方式，满足筛选条件的自变量会进入多因素回归模型！

注：多因素模型中的所有变量就是我们最终预测模型中全部的预测因子了，并不只是多因素中有意义的变量哦！如果希望预测模型中的变量P值均小于0.05，可以选择逐步回归分析中"根据P<0.05筛选"的选项！

自变量筛选方式也有3种：

基于分组差异性结果：
基于单因素回归结果
自定义

前两个比较相似，区别就在是根据差异性P值还是单因素P值进行筛选！

如果选择了"基于分组差异性"或"基于单因素回归"，只需要完成2步设置。

第一步，P阈值的选择，如果自变量个数过少，可以适当放宽标准，0.1、0.2也都是可以的。当选择不限制时，单因素的全部自变量都将纳入多因素回归分析。

第二步，是否开展逐步回归，选择“否”，就是我们常见的先单后多分析，另外逐步回归方法，平台也提供了多种选择：双向逐步回归，向前逐步回归，向后逐步回归以及考虑到有时P值大于0.05的变量在逐步回归时也会留在模型中，新增了根据P<0.05的原则开展逐步回归！大家可以根据研究需要自行选择。

如果选择了自定义筛选自变量，比如实际研究中，预测因子的筛选也需要结合专业知识以及相关文献进行判断，纯数据驱动也不太好。假如变量A在临床中是十分重要的变量，但是受限于样本原因，单因素与差异性均没有统计学意义，这时候，我们可以自定义挑选预测因子，选择我们预期的预测因子，自行选择是否需要逐步回归！也是一条途径！

选择完毕后，我们就得到了多因素回归的结果，现在多因素模型也就是我们最终的预测模型，列线图中会包含多因素回归中的全部变量！

完成预测模型的构建后，就可以同步给出模型得到验证结果啦！

4、决策曲线

点击"DCA曲线"模块，结果也同时输出，包括有训练集DCA曲线、验证集DCA曲线。

提供了R语言2个常见包的绘图结果，并且都提供了原生态、优化版，大家可以参考下方例图，选择自己喜欢的风格。

平台还支持对曲线是否平滑，进行处理，可以通过下方例图，比较具体差别，可以看到，非平滑处理的曲线会更加的崎岖，也是提供大家更多样的选择！

最重要的是，平台将R语言复杂的参数全部简化为了菜单式选项，可以个性化调整曲线的颜色（model、ALL线、None线）、粗细、线条类型等，还可以对图例/坐标轴的字体，大小，位置进行调整。

请注意！这里的颜色与坐标轴和标签修改设置仅对“优化后”曲线有效，对原生态曲线是无效的。

5、下载结果

最后在曲线下载设置中，选择下载图片（训练集还是验证集、原生态还是优化后），保存类型（支持pdf、jpeg、png、tiff)，曲线页面，中文字体。

如果需要在图片中添加中文字符，建议下载PDF进行二次编辑，再另存为图片！

选择完毕后，就可以下载DCA曲线啦！

下载下来的图片也十分清晰！

以上就是风暴统计平台绘制DCA曲线的全部操作流程啦！如果您在使用过程中出现报错，可以参考下方推文，排查一下问题所在哦！

答疑 | 风暴统计更换服务器后，为什么总出现同样的报错？

详情请点击下方：

2024年临床预测模型培训班6.29-30，无代码构建预测模型

风暴统计

关注

7
点赞
踩
29

收藏

觉得还不错? 一键收藏
0
评论
如何快速绘制logistic回归预测模型的DCA曲线？

临床预测模型，也是临床统计分析的一个大类，除了前期构建模型，还要对模型的预测能力、区分度、校准度、临床获益等方面展开评价，确保模型是有效的！区分度即通过ROC曲线表现，校准度通过校准曲线表现，但这两个指标无法为临床决策提供参考，在这种情况下，决策曲线分析（DCA）就显得很有意义了。决策曲线分析（DCA）是一种评估预测模型在实际临床决策中应用价值的方法。它通过比较不同决策方案（如对所有人进行治疗或对...
复制链接

扫一扫