本文为零代码复现系列文章3
今天给大家带来的复现内容是CHARLS数据库的一篇横断面研究文章,文章统计方法部分包括了①绘制KM曲线、②不拆分验证构建预测模型、③绘制列线图、④绘制校准曲线。
这些统计方法风暴统计统统一站式搞定,零代码操作,新手小白也可以轻松上手完成!
案例文献是一篇基于SEER公共数据库的二区,IF=12.5的文章,旨在绘制预测老年早期非小细胞肺癌手术后预后的列线图。
预测老年早期非小细胞肺癌手术后预后的列线图
1.1 KM曲线
文章中分别绘制了Age、 Sex、Histology、Grade、Tumor_Size和 Surgery分组下的KM曲线。
1.2 单因素+多因素COX回归
采用先单后多策略,将单因素COX回归结果P值<0.05的变量纳入多因素COX回归。
1.3 绘制列线图
根据多因素COX回归分析结果绘制列线图,展示人群3年与5年的生存风险。
1.4 绘制校准曲线
分别绘制3年、5年的校准曲线。
以上就是本篇SEER数据库文章的全部内容啦!(文章精读请看今天第二篇文章)下面我们将通过风暴统计平台进行结果复现!
风暴统计平台是由浙江中医药大学郑卫军教授基于R语言开发的统计分析平台,它具有以下优点:
-
结果输出简洁,直接生成三线表,支持word版下载!
-
平台是基于R语言进行开发,结果准确性有保障!
-
全部菜单式操作,统计小白也可以轻松上手!
2.1 复现数据介绍
我们复现用到的数据集是根据原文献变量及纳排标准整理的变量和原文保持一致,包含有:
便利起见,针对这篇文章的统计方法制作了专用链接,按顺序操作即可复现全部统计方法,不用在风暴统计平台换模块分析啦!
https://shiny.medsta.cn/feng/
2.2 数据导入
进入网页后,可以选择导入自己的数据进行分析,也可以选择示例数据(也就是我们本篇文献的复现数据)进行测试。
2.3 KM曲线
来到"生存曲线"板块,分别选入生存结局变量、生存时间变量、分组变量
平台就会直接给出KM曲线啦!还有风险表以及中位生存时间表。
2.3 单因素+多因素COX回归分析
来到“COX(不验证)模块”,因为原文献构建预测模型并没有拆分数据集,因此,我们也没有进行拆分验证。
在“cox预测模型”界面,分别选入生存结局变量、生存时间变量以及全部需要分析的自变量。
下面自变量筛选方式,我们选择P<0.05,即单因素P<0.05进入多因素回归分析。
接着,点击"单+多因素COX回归"就可以展示合并结果啦!无需手动绘制表格,合并结果,非常便捷!
2.4列线图
接着,来到"模型呈现、评价与验证"板块就可以得到列线图啦!
添加指定年份的预测概率,只需要在左侧菜单栏填写时间节点数字即可,这里复现数据的生存时间是以月份为单位,因此我们填写36与60,标签需要是英文格式哦!
由于界面有限,平台展示的略显拥挤,下载PDF后,就会十分清晰啦!
注:如果下载图片不完全,可以在"曲线下载设置"处将曲线页面由A4改为自定义,将长度与宽度调整为合适的大小。
2.5 校准曲线
这里还有3个参数需要设置:生存时间节点、曲线节点数、绘图抽样次数。
-
生存时间节点:时间节点一次只能输入一个数字,根据实际数据不同,一般会选择具有代表性的节点,比如30天,12周,3个月,1年,10年等,这个时间点一定是小于最长的有效随访时间。
-
曲线节点数:节点数关乎曲线的平滑度,节点数越多,图形划分越细致,展示信息也越多,但是在样本量较小的情况下,建议选择较少节点数避免过度波动。
-
绘图抽样次数:通常称为bootstrap次数,指从原数据集中随机抽取样本并进行多次重复来评估模型的稳定性,次数越多,结果越稳定,但是后台迭代运算需要花费的时间也越长,因此需要在稳定性与计算资源间找到平衡点,平台建议的是500,相关文献中使用1000次重抽样会常见一些。
3年期、5年期校准曲线(优化版与原生态),大家可以根据需要选择喜欢的样式!
以上就是我们本次零代码复现SCI文章的全部内容啦!是关于COX预测模型不拆分验证的分析流程!欢迎试用下方链接,进行复现与测试哦!
https://shiny.medsta.cn/feng/
如果您在使用过程中出现报错,可以参考下方推文,排查一下问题所在哦!
详情请点击下方: