logistic回归分析 r_基于R语言的Logistic回归模型构建与Nomogram绘制

本文详细介绍了如何使用R语言构建Logistic回归预测模型,并结合案例展示了绘制Nomogram的过程,包括数据预处理、模型拟合、模型验证与校准曲线的绘制。同时,文中讨论了模型构建中的变量选择与模型可操作性的重要性。
摘要由CSDN通过智能技术生成

题记:本章为预测模型系列方法学文章第3篇,主要介绍Logistic回归的预测模型构建方法与Nomogram的绘制。

1. 背景知识

本章我们将用一个具体案例来介绍用R语言构建Logistic回归预测模型并绘制Nomogram的完整过程。有关预测模型的构建流程我们将在下一章《预测模型系列04–基于R的生存资料预测模型构建与Nomogram绘制》中介绍;有关预测模型优劣的评价方法我们将在后续章节中介绍。我们可以把临床预测模型构建与验证的步骤总结为以下7个步骤:

(1)明确临床问题,确定科学假说

(2)根据既往文献,确定预测模型研究思路

(3)确定预测模型的预测变量

(4)确定预测模型的结局变量

(5)构建预测模型,计算模型预测值

(6)模型区分能力评估

(7)模型的准确性评估

其中步骤2有关预测模型的研究思路,大家可以参见本文图1.

a38691496c3efb75901aa379d9f89323.png

图1. 三种预测模型的研究思路

2. 案例分析

Hosmer和 Lemeshow于1989年研究了低出生体重婴儿的影响因素。结果变量为:是否娩出低出生体重儿(变量名为“low”,二分类变量,1=低出生体重,即婴儿出生体重<2500g;0=非低出生体重),考虑的影响因素(自变量)有:产妇妊娠前体重(lwt,磅);产妇年龄(age,岁);产妇在妊娠期间是否吸烟(smoke,0=未吸、1=吸烟);本次妊娠前早产次数(ptl,次);是否患有高血压(ht,0=未患、1=患病);子宫对按摩、催产素等刺激引起收缩的应激性(ui,0=无、1=有);妊娠前三个月社区医生随访次数(ftv,次);种族(race,1=白人、2=黑人、3=其他民族)。本案例因变量是二分类变量(是否低出生体重儿),研究目的是探讨低出生体重儿的独立影响因素,符合二元Logistic回归的应用条件。因为本例中,我们只有这一个数据集,可以用这个数据集作为训练集建模,然后在本数据集利用Bootstrap重抽样的方法进行模型验证。下面我们就基于R语言演示预测低出生体重儿的预测模型构建与Nomogram的绘制,我们把数据sav的数据格式整理好,命名为“lweight.sav”,保存在R语言当前工作路径下。具体分析步骤如下:

(1)首先筛选影响低出生体重儿的独立影响因素,构建Logistic回归模型;

(2)绘制Nomogram;

(3)计算模型的区分度 C-Statistics;

(4)重抽样的方法进行模型验证,并绘制Ca

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值