首先看看什么是生存分析?
因为无法在短时间内评价慢性病患者的预后,所以通常情况下不会简单地采用治愈率、病死率等指标,而是对患者进行随访,分析一定的时间之后患者生存或死亡的情况,这种将事件的结果和出现这一结果所经历的时间结合起来分析的方法,称为生存分析 (Survival Analysis)。
如何进行生存数据的收集和整理,有不少人存在疑惑,下面这张图给出了非常清晰明了的说明。
下面,对生存分析中常用到的代码进行了汇总,参考的文章已经附上链接,可以直接回溯到原文。
#一、使用数据集
library(survival)
#data(lung) # 加载lung数据集
mydata<-na.omit(survival::lung) #去除缺失值
View(mydata) # 查看数据集
str(mydata)
#二、数据字段说明
#survival包的lung数据集
#lung数据集:NCCTG晚期肺癌患者的生存率。
#inst:机构代码;
#time:生存天数(以天为单位的生存时间);
#status:生存状态,1为删失