r语言回归分析_R语言之cox回归分析

本文介绍了R语言中的Cox比例风险模型,用于分析带有时间的生存结局影响因素,如临床治疗效果。通过R包'survival'进行Cox回归,分析单因素和多因素下不同变量对患者生存的影响。结果解释涉及风险比(HR)、回归系数和显著性P值,展示了性别在死亡风险中的差异。
摘要由CSDN通过智能技术生成

   921be919ec71a870b907dacebad52afa.png

    Cox比例风险模型(Cox proportional-hazards model,也称为Cox回归),主要用于带有时间的生存结局的影响因素研究,或评价某个临床治疗措施对患者生存的影响。

    Cox模型可以由hazard function表示,h(t);简单的说就是t时刻死亡的风险,公式如下:

 h(t)=h0(t) × exp(b1x1 + b2x2 +…+ bpxp)

  •  t代表生存时间

  •  x1-xp代表协变量

  •  b1-bp代表协变量的回归系数

 R语言代码实现:

install.packages("survival")

library(survival)    

sur

#单因素Cox回归分析各个因素与患者生存的关系

summary(coxph(sur~x1,data=test))

#多因素Cox回归分析各个因素与患者生存的关系

summary(coxph(sur~x1+x2+x3,data=test))

f55f9c4c92b4d9a428777a1baf402f78.png

单因素Cox回归分析结果

698d72c3ae268d6db0cdd289f0115a51.png

多因素Cox回归分析结果

结果解释:

1、coef是公式中的回归系数b(有时也叫做beta值),因此exp(coef)则是Cox模型中最主要的概念风险比(HR-hazard ratio):

  • HR = 1: No effect

  • HR < 1: Reduction in the hazard

  • HR > 1: Increase in Hazard

在癌症研究中:

    hazard ratio > 1 is called bad prognostic factor

    hazard ratio < 1 is called good prognostic factor

2、z值代表Wald统计量,其值等于回归系数coef除以其标准误se(coef),即z = coef/se(coef);有统计量必有其对应的假设检验的显著性P值,其说明bata值是否与0有统计学意义上的显著差别

3、coef(-0.5310)值小于0说明HR值小于1,而这里的Cox模型是group two相对于group one而言的,那么按照测试数据集来说:male=1,female=1,即女性的死亡风险相比男性要低

4、exp(coef)等于0.59,即风险比例等于0.59,说明女性(male=2)减少了0.59倍风险,女性与良好预后相关

5、ower .95 upper .95则是exp(coef)的95%置信区间

6、Likelihood ratio test,Wald test,Score (logrank) test则是给出了3种可选择的P值,这三者是asymptotically equivalent;当样本数目足够大时,这三者的值是相似的;当样本数目较少时,这三者是有差别的,但是Likelihood ratio test会比其他两种在小样本中表现的更优

COX回归分析和nomogram是生存分析中常用的方法,R语言中有丰富的生存分析包,可以轻松实现这些分析。 首先需要安装并加载生存分析包`survival`和`rms`,可以使用以下命令: ``` install.packages(c("survival", "rms")) library(survival) library(rms) ``` 接下来,我们可以使用`coxph()`函数进行COX回归分析。以lung数据集为例,该数据集包含了228名肺癌患者的生存时间和一些基本信息,我们可以使用如下代码进行COX回归分析: ``` data(lung) fit <- coxph(Surv(time, status) ~ age + sex + ph.ecog + wt.loss, data = lung) summary(fit) ``` 其中,`Surv()`函数用于定义生存时间和事件,`time`表示生存时间,`status`表示生存状态(0表示存活,1表示死亡)。`age`、`sex`、`ph.ecog`、`wt.loss`为预测变量,可以根据实际情况进行修改。 输出结果中,`coef`列为每个预测变量的系数,`exp(coef)`列为各个预测变量的风险比(即相对危险度),`p`列为各个预测变量的显著性检验结果。 接下来,我们可以使用`nomogram()`函数生成nomogram图。nomogram图是一种直观的预测工具,可以根据个体的相关变量快速计算其生存概率。以上述COX回归分析结果为例,我们可以使用如下代码生成nomogram图: ``` nom <- nomogram(fit, fun = function(x) 1 - plogis(x), funlabel = "Survival Prob", predictor = TRUE, lp = TRUE) plot(nom) ``` 其中,`fun`参数用于定义生存概率函数,`funlabel`参数为生存概率函数的名称,`predictor`参数表示是否显示预测变量,`lp`参数表示是否显示线性预测(linear predictor)。 生成的nomogram图中,每个预测变量有一个刻度,每个刻度上有一个分数,可以通过将每个预测变量的分数相加,再在nomogram图中找到对应的总分数,即可得到该个体的生存概率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值