Logistic构建预测模型:如何用R语言绘制Logistic预测模型列线图?(附全套代码)...

Logistic构建临床预测模型系列主要以一篇基于logistic回归构建预测模型的文章为例,从整理数据到构建预测模型,再到内部验证模型,包括了整理数据、随机数据拆分、基线描述、差异性分析、绘制ROC曲线并计算AUC值、HL检验及绘制校准曲线、构建列线图模型并绘制DCA曲线,基本涵盖了Logistic构建预测模型的全过程,敬请期待!

列线图Nomogram:通过适当的数学变换将回归模型中的回归系数转换为分数,并将其绘制为列线图作为预测模型工具。本文属于Logistic构建临床预测模型系列文章第七篇,分别用R语言和风暴统计对Logistic预测模型列线图的绘制进行复现。系列文章详情请点击下方链接:

Logistic构建预测模型:SEER数据库文献解读

Logistic构建预测模型:如何用R语言整理数据?(附全套代码)

Logistic构建预测模型:如何用R语言拆分数据集并做基线差异性分析?(附全套代码)

Logistic构建预测模型:如何用R语言做Logistic单因素+多因素回归分析!(附全套代码)

Logistic构建预测模型:如何用R语言绘制精美的ROC曲线?(附全套代码)

Logistic构建预测模型:如何用R语言绘制校准曲线并做H-L检验?(附全套代码)

今日文章分为三部分

1.文章解读

2.R语言复现

3.小白绘制Logistic预测模型列线图

1.文章解读

案例文献是一篇基于SEER公共数据库的一项回顾性研究,旨在开发和验证列线图以预测脑转移的非小细胞肺癌患者早期死亡。

dd31c06de14325e1acb3b5812f180ba4.jpeg

背景:在非小细胞肺癌(NSCLC)的整个病程中,很多患者会出现预后差、死亡率高的脑转移(BM)。然而,很少有模型能预测有脑转移的NSCLC患者的早期死亡(ED)。我们旨在开发列线图来预测NSCLC脑转移患者ED。

方法:从监测、流行病学和最终结果(SEER)数据库中选取了2010年至2015年间患有BM的NSCLC患者。纳入标准如下:(I)患者经病理诊断为NSCLC;(II)患者患有BM。患者按7:3的比例随机分为两组,分别为训练组和验证组。采用单因素和多因素Logistic回归方法来确定伴有BM的NSCLC患者发生ED的危险因素。建立了两个列线图,并通过校准曲线、ROC曲线和决策曲线分析(DCA)进行了验证。随访数据包括生存月数、死因和生命状态。初次诊断后3个月内的死亡定义为ED,终点为全因ED和癌症特异性ED。

结果:共纳入了4,920名患有BM的NSCLC患者,并随机分为两个队列(7:3),包括训练队列(n=3,444)和验证队列(n=1,476)。全因ED和癌症特异性ED的独立预后因素包括年龄、性别、种族、肿瘤大小、组织学、T分期、N分期、分级、手术、放疗、化疗、骨转移和肝转移。所有这些变量都用于建立列线图。在全因ED和癌症特异性ED的列线图中,训练数据集的ROC曲线下面积分别为0.813(95% CI:0.799-0.837)和0.808(95% CI:0.791-0.830),验证数据集的ROC曲线下面积分别为0.835(95% CI:0.805-0.862)和0.824(95% CI:0.790-0.849)。此外,校准曲线证明预测的ED与实际值一致。DCA临床应用前景良好。

结论:列线图可用来预测患者死亡的具体概率,有助于治疗决策和重点护理,以及医患沟通。

本文构建logistic预测模型并做内部验证,思路框架清晰,案例十分典型。先拆分数据集为训练集和验证集,比例为7:3,验证集用于进行内部验证。然后做基线描述,比较训练集和验证集的基线差异性,再做单因素和多因素logistic回归,将单因素P值小于0.05的因素纳入到多因素回归模型中。再根据多因素回归的结果构建列线图预测模型,并对模型进行验证,绘制ROC、校准曲线及DCA曲线,模型比较稳定。

今天我们对本文的列线图绘制展开复现。下图是本文的列线图展示。

2f1df26e9b7d096443b88ba166933552.jpeg

b71160f5a556b89706b5ca13389ccfee.jpeg

2.R语言复现

2.1安装和加载R包

if(!require("rms")) install.packages("rms")
library("rms")

2.2绘制高级列线图

Nomogram <- lrm(All.cause.early.death ~ Age.years + Sex + Race + Marital + Grade + 
                                        Tumor.size.mm + Histology + T_stage + N_stage + Surgery + 
                                        Radiation + Chemotherapy + Bone.metastasis + 
                                        Liver.metastasis,data=train,x=TRUE,y=TRUE)
#代码解读:构建Logstic回归模型,~前为因变量,~后为自变量;
#data选择建模集,x=t和y=t的意思为在自变量及因变量出现缺失值时候的处理方式,数据集无缺失。
nom_train<-nomogram(Nomogram,
fun=function(x)1/(1+exp(-x)),#逻辑回归计算公式
                    lp=F,#是否显示系数轴
fun.at = c(0.05,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,0.95),#风险轴刻度
                    funlabel = "Early death probability")#风险轴便签
plot(nom_train)

1a019b0f428022084b3a71dda0cee70b.jpeg

3.小白绘制Logistic预测模型列线图


用它,小白也能绘制高级Logistic预测模型列线图,还能直接美化调整,不是吹的,看过就知道它有多好用!!

9655054ecb843dfc59aa4a99ccaf87e5.jpeg

3.1电脑端打开风暴统计平台——“风暴智能统计”模块,点击“临床预测模型(最新)”,进入“临床预测模型:内部验证”页面。

557162821ca62bc3438653a737112bd0.jpeg

3.2导入数据集total

dbf99d1bbe1365e940093e8ee017f9b6.jpeg

3.3拆分数据集,设置随机数字并确定拆分比例

87e2d2262f9a7ae1351006d3f467ff35.jpeg

3.4开展logistic回归分析

c2a822ccc82db979af6dce6a8d66cdca.jpeg

3.5结果直出。回归变量和多因素回归设置完成后,下方结果直接给出,如下图所示,快的让人震惊!!!

33c7c48fcad3deb95ecda60f2dc04273.jpeg

列线图显示设置直接小白式操作也可以画出非常精美曲线,这也太神了吧!

b9818902db0ada986f84c53103359df1.jpeg

选择自定义设置即可改变参数。

a1972a17a48981432eb70777a0619b19.jpeg

由于选入变量较多,显示区显示不完全,但是没关系,下载下来的图片非常美观,一般也不会有研究纳入这么多的变量!

68a49780af8c5a5857d4f124d5ddf91b.jpeg

6f38aab290caf4d407648b167f2f336c.png

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值