本文作者:酸辣个土豆。
大家好,我是酸辣个土豆,欢迎来到我的科研碎碎念
上一篇我们了解了一下生存分析的基本概念,今天,我们来聊一聊生存曲线。
生存曲线,最常见的就是Kaplan-Meier曲线,是一种在医学研究中常用的图表,用于描述不同组别患者的生存状况。这种曲线通常以时间为横坐标,以生存率为纵坐标,通过连接每个时间点的生存率,形成一条曲线。每一个点代表了在该时间点上的生存率,曲线的下降表示有患者死亡或发生了研究的阳性终点事件。
话不多说,我们先看一张图
生存曲线的解读
1.中位生存时间:累计生存率为50%时所对应的生存时间(上图A点所对应的时间)。
2.中位随访时间:生存时间的中位数(利用反K-M法计算,将出现结局事件定义为0,再利用K-M法估计)。
3.死亡速度越快,生存率越低,那么生存时间越短。(high风险组患者死亡速度较low风险组患者快,生存时间较短。当然,如上篇所述,生存分析里的“死亡”不仅仅指死亡)
4.出现阳性事件和出现删失:
5.统计检验:为了验证生存曲线之间的差异是否具有统计学意义,通常会使用log-rank检验或Cox比例风险回归模型等统计方法。(P值一般保留3位小数点)
下面我就展示一下如何作生存曲线(SPSS和R语言)。
1. SPSS
1)建立含有变量、生存状态、生存时间的Excel表格导入SPSS(本例使用SPSS26版本)。
2)选择对应的参数选入,将出现阳性事件定义为1。
3)做出生存曲线图,并进行调整。
2.R语言
#安装R包
install.packages("survival")
install.packages("survminer")
#加载R包
library(survival)
library(survminer)
#读取数据
data<- read.csv("Survival.CSV")
#拟合生存模型
fit <- survfit(Surv(OS, Status) ~ Risk, data = data)
#作图
p<- ggsurvplot(fit, data = data,、#标题字体
font.title = c(10, "bold", "darkblue"), #副标题字体
font.subtitle = c(11, "italic", "purple"), #说明字体
font.caption = c(10,"plain","orange"), #x轴字体
font.x = c(11), #y轴字体
font.y = c(12), #添加风险表及调整参数
fun = "pct",risk.table = T,
risk.table.y.text.col = T,
risk.table.height = 0.25,
risk.table.y.text = FALSE,size = 0.8,#调色
palette=c(),#标签及标签命名
legend.labs=c("high","low"),
legend.title="Risk",#更改横纵坐标及参数
ylab="Overall Survival(%)",
xlab = " Time (months)",
censor.shape = 124,censor.size = 2,
conf.int = FALSE,
break.x.by = 20,
xlim = c(0,85), #添加中位生存时间
surv.median.line = "hv",pval = T,
ggtheme = theme_classic())
#呈现生存曲线
p
注:若对内容有疑惑或者发现有明确错误的朋友,请联系后台(希望多多交流)。更多内容可关注公众号:生信方舟
- END -