生存分析函数小结

http://bbs.sciencenet.cn/blog-252888-719677.html 

生存分析(survival analysis)适合于处理时间-事件数据。例如中风病人从首次发病到两次复发,其中就涉及到时间和事件。此例中时间就是复发的时间间隔,事件就是是否复发。如果用普通的线性回归对复发时间进行分析,就需要去除那些没有复发的病人样本。如果用Logistic回归对是否复发进行分析,就没有用到时间这个因素。而生存分析同时考虑时间和事情这两个因素,效果会更好些。


在R语言中我们可以使用survival包进行生存分析,其中主要的函数功能罗列如下:

Surv:用于创建生存数据对象
survfit:创建KM生存曲线或是Cox调整生存曲线
survdiff:用于不同组的统计检验
coxph:构建COX回归模型
cox.zph:检验PH假设是否成立
survreg:构建参数模型



下面是使用一个实例来使用R中的生存分析函数,其中用到的数据集可以在 这里下载

12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788
# Example from Survival Analysis- A Self-Learning Text, Third Edition
 
library (survival )
addicts  <- read.table ( 'ADDICTS.txt' , T )
names (addicts ) <- c ( 'id' , 'clinic' , 'status' , 'survt' , 'prison' , 'dose' )
 
# 1. 估计生存函数,观察不同组间的区别
 
# 建立生存对象
Surv (addicts $survt ,addicts $status == 1 )
 
# 估计KM生存曲线
<- Surv (addicts $survt ,addicts $status == 1 )
kmfit1  <- survfit (y ~ 1 )
summary (kmfit1 )
plot (kmfit1 )
 
# 根据clinic分组估计KM生存曲线
kmfit2  <- survfit (y ~addicts $clinic )
plot (kmfit2 , lty  = c ( 'solid' , 'dashed' ), col =c ( 'black' , 'blue' ),
    xlab = 'survival time in days' ,ylab = 'survival probabilities' )
legend ( 'topright' , c ( 'Clinic 1' , 'Clinic 2' ), lty =c ( 'solid' , 'dashed' ),
      col =c ( 'black' , 'blue' ))
 
# 检验显著性
survdiff (Surv (survt ,status ) ~clinic , data =addicts )
 
# 用strata来控制协变量的影响
survdiff (Surv (survt ,status ) ~ clinic  +strata (prison ),data =addicts )
 
# 2. 用图形方法检验PH假设
 
plot (kmfit2 ,fun = 'cloglog' ,xlab = 'time in days using logarithmic
    scale' ,ylab = 'log-log survival' , main = 'log-log curves by clinic' )
# 不平行,不符合PH假设
 
#  3. 构建COX PH回归模型
 
<- Surv (addicts $survt ,addicts $status == 1 )
coxmodel  <- coxph (y ~ prison  + dose  + clinic ,data =addicts )
summary (coxmodel )
 
# 两模型选择
mod1  <- coxph (~ prison  + dose  + clinic ,data =addicts )
mod2  <- coxph (~ prison  + dose  + clinic  + clinic *prison
+ clinic *dose , data =addicts )
 
anova (mod1 ,mod2 )
stepAIC (mod2 )
# 简洁模型更好
 
# 风险预测
predict (mod1 ,newdata =pattern1 ,
       type = 'risk' )
 
# 4. 构建一个stratified Cox model.
 
# 当PH假设在clinic不成立,控制这个变量
mod3  <- coxph (~ prison  + dose  +
               strata (clinic ),data =addicts )
summary (mod3 )
 
#  5.对PH假设进行统计检验
 
mod1  <- coxph (~ prison  + dose  + clinic ,data =addicts )
cox.zph (mod1 ,transform =rank )
# P值小显示PH假设不符合
# 显示系数变化图
plot (cox.zph (mod1 ,transform =rank ),se = F ,var = 'clinic' )
 
#  6. 得到COX调整后生存曲线
 
mod1  <- coxph (~ prison  + dose  + clinic ,data =addicts )
pattern1  <- data.frame (prison = 0 ,dose = 70 ,clinic = 2 )
summary (survfit (mod1 ,newdata =pattern1 ))
plot (survfit (mod1 ,newdata =pattern1 ),conf.int = F )
 
mod3  <- coxph (~ prison  + dose  +
               strata (clinic ),data =addicts )
pattern2  <- data.frame (prison = .46 ,dose = 60.40 )
plot (survfit (mod3 ,newdata =pattern2 ),conf.int = F )
 
# 7. 构建参数模型
 
modpar1  <- survreg (Surv (addicts $survt ,addicts $status ) ~
                    prison  +dose  +clinic ,data =addicts ,
                  dist = 'exponential' )

summary(modpar1)


需要事先加载包 library(MASS)

  • 8
    点赞
  • 58
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
### 回答1: copula函数函数与生存函数没有直接的关系。Copula函数是用于描述多维随机变量之间的依赖关系的函数,而生存函数则是用于描述一个随机变量的概率分布函数。它们所描述的对象和概念不同,因此它们之间没有直接的关系。 ### 回答2: copula函数(联合分布函数)是用来描述多变量随机事件之间的相关关系的函数,它的取值介于0和1之间。而生存函数是描述一个事件发生时间的概率分布函数,它表示该事件在任何给定时间点尚未发生的概率。 copula函数与生存函数之间的关系可以通过如下步骤得到: 首先,通过求偏导数得到copula函数的密度函数。然后,将密度函数转换为生存函数的形式。 假设我们有两个随机变量X和Y,它们的copula函数为C(u,v),其中u和v分别是X和Y在它们各自边缘分布函数中的累积分布概率。 为了得到copula函数的密度函数c(u,v),我们需要对copula函数关于u和v分别求偏导数,即dc(u,v)/du和dc(u,v)/dv。将得到的偏导数分别乘以边缘分布函数的密度函数f(x)和g(y),得到乘积dc(u,v)/du*f(x)和dc(u,v)/dv*g(y)。然后我们将两个乘积相乘,并除以X和Y的边缘密度函数f(x)*g(y),即可得到copula函数的密度函数c(u,v)。 通过计算得到copula函数的密度函数c(u,v),我们可以得到联合生存函数S(x,y)的表达式。具体而言,联合生存函数由copula函数的密度函数以及X和Y的边缘生存函数S(x)和S(y)组成。联合生存函数可以用来描述事件X和Y在给定时间点x和y之前均未发生的概率。 总结起来,copula函数与生存函数之间存在紧密的联系。通过求导计算copula函数的密度函数,然后进行转换,可以得到联合生存函数的表达式,用来描述事件在给定时间点之前未发生的概率。 ### 回答3: copula函数和生存函数之间存在一定的关系。copula函数是用于描述多维随机变量之间的依赖关系的函数,而生存函数是描述随机变量的生存概率的函数。在生存分析中,通常使用copula函数来模拟多维生存数据中的共同概率分布。具体而言,生存函数可以由copula函数推导得出。 一般而言,在生存函数中,我们通过计算累积分布函数得到生存概率,而copula函数则通过将多维随机变量的边际分布函数与联合分布函数联系起来,描述了这些变量之间的依赖结构。在生存分析中,我们常常需要研究多个生存时间之间的相关性,而copula函数提供了一种有效的方法来描述这种相关性。 通过将生存函数中的各个边际生存概率与copula函数进行组合,可以得到多维生存数据的联合生存函数。这个联合生存函数可以用来计算多个随机变量在同一时间点生存下来的概率。因此,可以说copula函数函数与生存函数之间存在一种映射的关系。 总而言之,copula函数函数主要用于描述多维随机变量之间的依赖关系,而生存函数则用于描述生存时间的概率。通过将copula函数与边际分布函数相结合,可以得到生存函数,从而得到多个随机变量在同一时间点生存下来的概率。
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值