如何快速构建COX预测模型并绘制列线图?

详情请点击下方:

2024年临床预测模型培训班6.29-30,无代码构建预测模型


列线图(Aligmment Diagram),又称诺莫图(Nomogram图),用来把多因素回归分析结果(logistic回归和cox回归)用图形方式表现出来,将多个预测指标进行整合,然后采用带有刻度的线段,按照一定的比例绘制在同一平面上,从而用以表达预测模型中各个变量之间的相互关系。

目前,比较传统绘制列线图的方法,还是使用R语言,但是对代码小白来说还是有点困难的,从数据拆分——建模——绘图,需要逐步修改代码参数,较为费心费力。

6dbfe8175eccf41d0beea8e38e5e2b00.png

因此,这里为大家推荐一个统计分析小工具——风暴统计,可以超快速完成COX回归构建列线图的制作!还可以添加多个时间点的预测概率!

风暴统计是由浙江中医药大学的郑卫军教授基于R语言开发的,不仅结果准确性有保障,并且全部实现菜单化操作,统计小白也可以轻松上手,绘制精美的列线图!

下面我们就结合一份实操数据来为大家详细介绍一下具体的操作步骤吧!

百度、必应Bing搜索“风暴统计”

本平台上线的所有工具都是免费的

271795326e9a240f969e5c045a5bbb4a.png

1、进入风暴统计平台

首先,浏览器搜索风暴统计,依次点击"风暴智能统计"——"临床预测模型"!平台有"内、外部验证"版及“只建模不验证”版。

通常构建预测模型都需要对模型进行验证,内部验证是必须的,条件允许情况下,进行外部验证也是很好的,因此,构建预测模型研究中,推荐大家使用"内、外部验证"版。

"只建模不验证"版更多用在影响因素研究中,可以绘制ROC曲线进行探索分析,或者计算约登指数。

进入分析界面后,根据提示,完成数据的导入与整理。这里我们不再赘述数据的导入与整理过程,详细教程大家可以点击下方链接:

详细指南!风暴统计如何高效导入数据,统计分析快人一步?

详细版!如何利用风暴统计进行数据的整理转换?

33be3937ea2d14fbdc97a06f423fa596.png

2、数据集拆分

预测模型都需要内部验证,内部验证的方法有随机拆分、交叉验证、Boostrap等。但风暴统计平台目前仅能做随机拆分法内部验证。

随机拆分法内部验证,顾名思义就是将原始数据集按照7:3(常见)或者6:4等比例进行拆分,一部分用于建模,另外一部分用于验证模型。

9476cc5cc6ea742a3ae71872fb3213cc.png

风暴统计支持两种拆分方式:随机拆分法、导入已拆分好的数据。

  • 如果选择“随机拆分”,需要设置随机种子拆分比例。随机种子对于数字位数没有要求,作用是可以保证拆分数据的分析结果可以复现,平台默认是1234,拆分比例更好理解,只需要拖动滑条,蓝色部分就是训练集的数据占总数据的比例。

81219b1567994245faa7f8ef1747989f.png

  • 如果选择“导入已拆分好的数据”,需要设置事先在导入的数据集中增加一列用于区分训练集和验证集的变量,比如新增列叫"group",通过编码赋值1代表训练集,2代表验证集。那么第一步:选入区分训练集与验证集的变量,第二步:勾选代表训练集的编码值!

    注:“导入已拆分好的数据”不仅可以做内部验证,更重要还可以用来做外部验证哦!同样需要一列变量来区分训练集和外部验证集!

e89d605bc89d75a7ad7e0661a123bed1.png

这里,我们额外介绍一下随机种子,随机种子的目的是为了保证分析结果可复现,因为数据的拆分具有随机性,在R语言分析中,如果不设置随机种子,那么每次拆分产生的训练集与验证集就不一样,分析结果也会不一样。

平台设有默认随机种子1234,如果不修改,每次分析结果是一样的。此外,对随机种子没有特别要求,任意几位数字都可以。

3、构建预测模型

完成数据记得拆分后,我们就可以开始构建预测模型啦!请注意,预测模型的构建仅在训练集开展哦!

预测模型的本质,简单来说,也就是多因素回归模型!多因素回归听上去是不是平易近人许多?风暴统计可以超快速完成这一步!

首先,选择模型变量——生存结局变量生存时间变量自变量。结局变量必须是以0和1赋值的二分类变量哦!生存时间变量也就是我们的随访时间,应该是定量连续数据,自变量就可以放入我们数据中所有可能的预测因子!

bdc5545580b11421499ca8ba7ccc3194.png

然后,平台超快速就给出了批量单因素分析的结果!

951b54e95ce8b8739a1f3007b25a0302.png

接着,定义模型自变量筛选的方式,满足筛选条件的自变量会进入多因素回归模型!

注:多因素模型中的所有变量就是我们最终预测模型中全部的预测因子了,并不只是多因素中有意义的变量哦!如果希望预测模型中的变量P值均小于0.05,可以选择逐步回归分析中"根据P<0.05筛选"的选项!

d93273dcc60712f86c5049fe6416480e.png

自变量筛选方式也有3种:

  • 基于分组差异性结果

  • 基于单因素回归结果

  • 自定义

前两个比较相似,区别就在是根据差异性P值还是单因素P值进行筛选!

如果选择了"基于分组差异性"或"基于单因素回归",只需要完成2步设置。

第一步,P阈值的选择,如果自变量个数过少,可以适当放宽标准,0.1、0.2也都是可以的。当选择不限制时,单因素的全部自变量都将纳入多因素回归分析。

第二步,是否开展逐步回归,选择“否”,就是我们常见的先单后多分析,另外逐步回归方法,平台也提供了多种选择:双向逐步回归,向前逐步回归,向后逐步回归以及考虑到有时P值大于0.05的变量在逐步回归时也会留在模型中,新增了根据P<0.05的原则开展逐步回归!大家可以根据研究需要自行选择。

0e361392e47d2045284adb3706bb3d72.png

0dff362aa90f40164c06699298a17d66.png

如果选择了自定义筛选自变量,比如实际研究中,预测因子的筛选也需要结合专业知识以及相关文献进行判断,纯数据驱动也不太好。假如变量A在临床中是十分重要的变量,但是可能受限于样本或其他原因,单因素与差异性均没有统计学意义,这时候,我们可以自定义挑选预测因子,选择我们预期的预测因子,自行选择是否需要逐步回归!也是一条途径!

02498d521bea841555c95e2754041340.png

选择完毕后,我们就得到了多因素回归的结果,现在多因素模型也就是我们最终的预测模型,列线图中会包含多因素回归中的全部变量(无论多因素回归中是否有意义)

e17b2ecd0a3aee6b03fded01af649dbf.png

进入“模型呈现、评价与验证“部分,就会出现我们最终的列线图啦!受浏览器展示的影响,在线展示版可能略显拥挤,后面针对这样的情况会再教大家具体处理方法。

626836f5176664a56d15a58a67cdd906.png

还可以增加特定时间点的预测概率,最多可以增加3个时间节点!这里的时间必须包含在有效随访时间内(时间点选取不合理,平台分析不出结果的哦),此外,标题只能是英文格式!

27ea047b57039260c0bca263f0f40967.png

5aec778284eb4b799150774d0da10e95.png

最重要的是,平台将R语言众多的细节参数设置全部转为了菜单式操作,像是刻度、变量值、变量、图全部支持自定义!

7af70777616981e5fbb307120c4458a0.png

4、下载结果

最后在曲线下载设置中,选择图片保存类型,曲线页面(A4或自定义)。

b80690172364c2ae345bf16b215d8237.png

最后,当预测因子比较多,或者浏览器界面放大比例的情况,可能图片会出现文字线条拥挤的情况,请不要着急!这里教你万能解决办法!

①界面展示调节:在浏览器界面调节缩放比例,可以使风暴统计界面的图片展示比较舒展适宜

764370b64597cd0fad593c3fa1f1bf55.png

②双管齐下:“列线图设置”中调整“行间距”+"曲线下载设置"中调整页面大小!

调整完成后,我们下载的图片就十分美观啦!如果需要编辑文字为中文,或修改变量标签,建议下载pdf,二次编辑后再另存为图片就好!

35471ef61b2ed6452c68edddb1fd258c.png

以上就是风暴统计平台绘制COX回归列线图的全部操作流程啦!如果您在使用过程中出现报错,可以参考下方推文,排查一下问题所在哦!

答疑 | 风暴统计更换服务器后,为什么总出现同样的报错?

  • 23
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
东南亚位于我国倡导推进的“一带一路”海陆交汇地带,作为当今全球发展最为迅速的地区之一,近年来区域内生产总值实现了显著且稳定的增长。根据东盟主要经济体公布的最新数据,印度尼西亚2023年国内生产总值(GDP)增长5.05%;越南2023年经济增长5.05%;马来西亚2023年经济增速为3.7%;泰国2023年经济增长1.9%;新加坡2023年经济增长1.1%;柬埔寨2023年经济增速预计为5.6%。 东盟国家在“一带一路”沿线国家中的总体GDP经济规模、贸易总额与国外直接投资均为最大,因此有着举足轻重的地位和作用。当前,东盟与中国已互相成为双方最大的交易伙伴。中国-东盟贸易总额已从2013年的443亿元增长至 2023年合计超逾6.4万亿元,占中国外贸总值的15.4%。在过去20余年中,东盟国家不断在全球多变的格局里面临挑战并寻求机遇。2023东盟国家主要经济体受到国内消费、国外投资、货币政策、旅游业复苏、和大宗商品出口价企稳等方面的提振,经济显现出稳步增长态势和强韧性的潜能。 本调研报告旨在深度挖掘东南亚市场的增长潜力与发展机会,分析东南亚市场竞争态势、销售模式、客户偏好、整体市场营商环境,为国内企业出海开展业务提供客观参考意见。 本文核心内容: 市场空间:全球行业市场空间、东南亚市场发展空间。 竞争态势:全球份额,东南亚市场企业份额。 销售模式:东南亚市场销售模式、本地代理商 客户情况:东南亚本地客户及偏好分析 营商环境:东南亚营商环境分析 本文纳入的企业包括国外及印尼本土企业,以及相关上下游企业等,部分名单 QYResearch是全球知名的大型咨询公司,行业涵盖各高科技行业产业链细分市场,横跨如半导体产业链(半导体设备及零部件、半导体材料、集成电路、制造、封测、分立器件、传感器、光电器件)、光伏产业链(设备、硅料/硅片、电池片、组件、辅料支架、逆变器、电站终端)、新能源汽车产业链(动力电池及材料、电驱电控、汽车半导体/电子、整车、充电桩)、通信产业链(通信系统设备、终端设备、电子元器件、射频前端、光模块、4G/5G/6G、宽带、IoT、数字经济、AI)、先进材料产业链(金属材料、高分子材料、陶瓷材料、纳米材料等)、机械制造产业链(数控机床、工程机械、电气机械、3C自动化、工业机器人、激光、工控、无人机)、食品药品、医疗器械、农业等。邮箱:market@qyresearch.com
Cox回归是一种常用于生存分析的统计方法,用于研究事件发生时间与影响因素之间的关系。R语言是一种广泛使用的统计分析工具,它可以用于绘制Cox回归的列线图。 要绘制Cox回归的列线图,首先需要使用R中的survival包来进行生存分析和Cox回归分析。survival包提供了用于处理生存数据的函数,其中包括进行Cox回归的函数。 在进行Cox回归分析之后,我们可以得到每个影响因素的估计系数以及相应的标准误差。根据这些结果,我们可以计算出每个影响因素的风险比(Hazard Ratio)以及相应的置信区间。 接下来,我们可以使用R中的ggplot2包来绘制列线图。ggplot2是一个功能强大的绘图工具,它提供了灵活的图形语法,可以使图形的绘制变得更加简洁和美观。 在绘制Cox回归的列线图时,我们可以将每个影响因素的风险比绘制为柱状图,并在柱状图上添加误差线表示置信区间的范围。此外,我们还可以使用颜色或其他图形属性来区分不同的影响因素。 最后,我们可以添加标题、轴标签和图例等细节,使图形更加清晰易懂。通过观察列线图,我们可以直观地了解每个影响因素对事件发生时间的影响程度,以及它们的置信区间。 总之,使用R语言中的survival包进行Cox回归分析,然后利用ggplot2包绘制列线图,可以帮助我们更好地理解影响因素对事件发生时间的影响。这样的图形可以为研究者提供直观、清晰的结果展示,进一步助力生存分析的解释和模型解读。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值