php 算生存曲线,手把手教你解读生存曲线

生存曲线最早来自于生物学概念

1928年,生存曲线(又称存活曲线)首次由美国生物学家雷蒙·普尔提出,它可以反映不同种群在每个年龄段生存的数目。存活曲线一般以存活数量的对数值为纵坐标,以年龄为横坐标作图,从而把每一个种群的死亡-存活情况绘成一条曲线。

存活曲线可归纳为3种基本类型:Ⅰ型表示大部分个体都能活到生理寿命,如人类和一些大型哺乳动物;Ⅱ型表示各年龄期存活率基本相似,如大多数鸟类;Ⅲ型则代表在生命早期有极高的死亡率,但是一旦活到某一年龄,死亡率就变得很低而且稳定,如树木等。

Kaplan-Meier曲线取名真的是因为人名

1958年,Edward L. Kaplan 和Paul Meier也首次在临床研究中提出了生存曲线的概念,又被称作Kaplan-Meier曲线,主要用来对各组患者的生存状况进行描述。需要注意的是,生存曲线是不能用单个数字来概括的,例如中位生存率或5年生存率,想知道为什么吗?别急,接着看下去你就知道了。

为什么要绘制生存曲线?

绘制生存曲线最主要的目的是进行生存分析,即通过将终点事件和出现这一终点所经历的时间结合起来进行统计分析,从而对两组患者的预后进行比较。这时候你可能会问,明明比较两组患者的总生存时间就可以进行预后分析了,做什么要劳神费力的去绘制生存曲线?

然而,生存时间无法一概而论。生存时间包括完全数据和删失数据两种类型。完全数据是大家最容易理解的患者从起点至死亡(死于所研究疾病)所经历的时间,那么删失数据又该如何作解呢?原来在漫长的随访过程中,有些受试者会因为一些原因失访,又或者是在随访中途死于非终点事件(如死于其他疾病或车祸等意外事故),这些数据在临床研究中即被称为删失案例。如此看来,在进行预后分析时,仅比较患者的生存时间显然是不合理的。读到这里,你可能又会问,那不比较总生存时间了,我把随访时间缩短到一个固定值,比较1年生存率或5年生存率总可以了吧?

不错,这个方法乍一听确实可行,但再一细想,似乎也存在瑕疵。在这里举个例子便于大家理解,某研究者通过比较1年生存率对A/B两组肝癌患者进行预后分析。不幸的是,1年后两组患者均死亡,按理说仅比较生存率,两组患者的预后是相同的。但是再仔细看看每组患者的具体资料,发现A组患者在随访第5天就全部死亡了,而B组患者直到随访第360天才全部死亡,粗粗算来B组患者比A组患者多活了300多天,预后显然更好,可见仅仅比较某个特定时间点的生存率也是不太科学的做法。而生存曲线则能够显示每个随访时间点上患者的生存率,显然是对患者进行预后分析的最佳方案。[1]

如何解读生存曲线?

图一[2]:从BCIRG-005研究中的OS生存曲线可以观察到:随着随访时间的增加,生存率从1逐渐开始下降,AC→D方案或TAC方案的5年OS率分别为88.9%与88.1%,证明AC→D方案的OS与TAC相当。

图一是从乳腺癌的BCIRG-005 研究中截取的一张生存曲线图。这项研究旨在比较在淋巴结阳性,人表皮生长因子受体(HER)-2阴性患者中多柔比星 环磷酰胺序贯多西他赛方案(AC→T)与多西他赛 多柔比星 环磷酰胺(TAC)方案的临床疗效,主要终点为患者的总生存率(OS)或无病生存率(DFS)。研究共纳入3298例乳腺癌患者,患者被随机分为AC→T或TAC组,用生存曲线对两组患者的生存状况进行了描述,生存曲线的横坐标代表随访时间,纵坐标一般代表的是生存率。

log-rank 检验

从图上来看,两组患者的生存率似乎差异不大,在随访第5年,AC→D组的OS为88.9%,TAC组的OS为88.1%,这是不是就说明AC→D组的预后比TAC组更优呢?

当然不是,当两组患者的观察终点出现差异时,有两种情况,一种是由于分组因素造成的,另外还有可能是由于随机抽样误差造成的,这时候为了证明两组患者之间的差异具有统计学意义,还需要对生存曲线进行假设检验,即log-rank 检验。该检验在常用的统计软件中均可实现。经log-rank 检验后,当P<0.05时,说明两组患者的观察终点差异并不是由抽样误差造成的,而是由分组因素造成的,而图一中的log-rank P=0.37,说明两组患者间出现的OS差异是由抽样误差造成的,并不存在统计学上的意义。

随访时间

如果随访时间过短,则两组患者的差异是没有统计学意义的。就拿上述的BCIRG-005 研究来说,如果将随访时间缩短到十几天甚至几天,可以观察到两组患者的生存曲线是重合的,根本无法计算出差异。反之,将随访时间延长后,才能更好的评价患者的长期生存状况,获知不同干预方式的治疗差异,使得研究质量更高。

曲线走形

生存曲线是一条下降的曲线,分析时应注意曲线的高度和下降的坡度。平缓的生存曲线表示高生存率或较长生存期,陡峭的生存曲线表示低生存率或较短的生存期。另外,两条曲线之间的距离越大,说明两组患者的终点事件发生率的差异也越大,换句话说就是越容易出现统计学差异。

标注删失值

[3]

一般来说, 没有删失病例的生存曲线是很少见的, 除非所有的入组患者全部存活(全部存活即全部删失)或者在观察时间内全部患者都死于所观察的疾病, 这种情况是不常见的。有删失值的生存曲线较之缺乏删失值的生存曲线更加严谨、更加可信。在上面的例子中我们可以观察到,时间刻度5对应的生存曲线上有一个蓝色的小圆点,即表示该点有删失病例。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值