Cox模型中的时间依存协变量和时间依存系数（R语言）第二部分

最新推荐文章于 2025-03-03 23:07:54 发布

Vinyyu

最新推荐文章于 2025-03-03 23:07:54 发布

阅读量1w

点赞数 12

分类专栏：生存分析文章标签：算法 r语言

本文链接：https://blog.csdn.net/weixin_44809950/article/details/89444941

版权

本文介绍了Cox比例风险模型中时间依存协变量和时间依存系数的概念，通过R语言展示了如何处理这些效应。通过实例分析了Karnofsky得分对风险的影响随时间变化的情况，探讨了阶梯函数和连续时间依存系数的构建方法。此外，还讨论了时间依存协变量的处理，包括可预测时间依存协变量的处理，强调了正确构建和处理时间依存效应的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

4. 时间依存系数

时间依存协变量(covariates)和时间依存系数(coefficients)是两种不同的扩展Cox模型，如下面的两个等式所示。
$\lambda(t)=\lambda_0(t) e^{\beta X(t)}$ (1)
$\lambda(t)=\lambda_0(t) e^{\beta (t)X}$ (2)

等式（1）是时间依存协变量，是一种常用且易于理解的用法。等式（2）具有时间相关系数，这种模型不太常见，但代表了一种处理非比例风险的方法。而通常比例风险假设恰恰是不随时间变化的系数： $\beta (t)=c$ 。cox.zph函数将绘制研究的 $\beta (t)$ 的估计值，用于诊断和理解非比例危险。以下是一个使用退伍军人癌症数据veteran的测试案例。

library(survival)
options(show.signif.stars=FALSE)
vfit<-coxph(Surv(time,status)~trt+prior+karno, veteran)
vfit

在这里插入图片描述

quantile(veteran$karno)

zp<-cox.zph(vfit, transform=function(time) log(time+20))
zp

在这里插入图片描述

plot(zp[3])
abline(0,0, col=2)
abline(h=vfit$coef[3], col=3, lwd=2, lty=2)

在这里插入图片描述
Karnofsky得分是一个非常重要的预测因子，但它的效果随着时间的推移并不是恒定的，如测试结果和绘图所示。在早期它有一个很大的负面效果：在第一个四分位值的病人，风险大约是在第三个四分位数值的病人的exp(35 * .03377)=3.2倍；但到了200天，这种关系已经减少到并没有多少，和零差不多了。一种解释是，在这种非常严重的疾病中，任何超过6个月之前的措施都不再适用。

比例风险模型估计的是随时间的平均危险，其值由虚线水平线表示。使用平均危险通常是合理的，比例风险假设毕竟不是那么精确的。然而，在这种情况下，与均线的背离是如此之大，这时依赖于时间的系数是对实际状态则是一种更有用的总结。 cox.zph图非常适合诊断，但不能产生一个合适的 $\beta (t)$ ，那么我们如何来建立这个模型呢？