R语言--Cox模型校准曲线原理(二)算法

本文详细介绍了R语言中Cox模型校准曲线的计算过程,包括Kaplan Meier法计算的实际生存率、平均预测生存率及标准误的计算。通过实例分析了分组的依据和生存率预测值的确定方法,为进一步理解Cox模型提供帮助。
摘要由CSDN通过智能技术生成

系列文章目录

R语言–Cox模型校准曲线原理(一)数据



前言

上一节给自己留了个坑,这赶紧过来填上。众所周知Cox模型的校准曲线数据是rms包中的calibrate函数计算而来的。那里面的数据到底是如何计算来的?搞清楚了这个,或许对进一步了解cox模型有一定帮助。


一、回顾校准曲线绘图数据

第二排数据的来源,也就是mean.predicted,KM,std.err是如何计算的呢?这几个数据是不需要迭代就能算出来的。剩余的数据和1000次bootstrap(自助法抽样)后计算相关。
在这里插入图片描述

  • KM: 生存分析中的Kaplan Meier法简称KM法。calibrate函数计算的结果(以下简称cal)中的KM数据得就是通过Kaplan Meier法计算得到的实际*年生存率
  • mean.predicted: 就是通过模型计算而来的平均*年生存率。
  • std.err: 是预测生存率的标准误。

二、计算

为了更清楚解决这个问题,采用R语言中lung数据框中的数据,方便大家复现以及发现问题。

1.分组

在通过KM法构建COX模型的校准曲线时,会根据病例的风险进行分组,然后计算每组的平均值,关于这里为什么分组,是因为,KM法计算生存概率时对病例数有一定的要求,通俗来说就是,如果只有一两个病人,是无法计算他的*年生存率的,因此分组数不能太多导致各组病例数较少,大部分文献中分3组至4组就差不多了。

这里先弄清楚两个问题:

  • 根据什么分组: 根据*年预测生存概率
  • 怎么计算*年生存概率预测值: 山人自有妙计
##随便构建一个cox模型并绘制一个默认的校准曲线
set.seed(1234)
ind <- sample(1:2,size = nrow(a),prob = c(0.7,0.3),replace =T)
train <- a[ind==1,]
test <- a[ind==2,]
dd=datadist(train
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一口吃两口饭

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值