目录
生存分析基本概念
logistic回归中因变量是终点事件发生与否,而生存分析则关注的是终点事件所经历的时间。
生存资料的特点:1.随访资料,包括两个方面时间和结局;2.时间—事件变量;3.有不完全数据;
生存分析:就是用来研究“生存”过程的统计方法;研究生存时间;时间与事件的关系
生存资料的三要素:
- 研究因素
- 生存时间
- 生存结局
生存资料的分析:
(1)估计:根据样本生存资料估计总体生存率和其他有关指标;
(2)比较:对不同组生存曲线进行比较;
(3)影响因素分析:目的是探索和了解影响预后的因素,或平衡某些因素的影响后,研究某个或者某些因素对生存的影响。
生存时间(survival time):根据研究目的确定的观察起点到某一给定终点 事件出现的时间。 类型:
(1)完全数据:随访研究中,在规定的时间内,若观察到某些对象的死亡结局所经历的时间,称为生存时间的完全数据。
(2)删失数据:随访研究中,在规定的时间内,由于某些原因未能观察到某些对象的死亡结局,提供的是从手术到停止观察的时间长度,并非确切的生存时间,称为生存时间的删失数据(censored data)
删失常见的原因:
- 研究结束时终点事件未发生
- 由于未继续就诊、拒绝随访或失去联系等失访,未能观察到其死亡结局
- 因死于其他原因终止观察
起始事件:标志研究对象生存过程开始的特征事件,又称为起点事件,与终点事件相对应。
终点事件:指研究者所关心的特定事件,又称为失效事件,标志着“生存”的终止。失效事件不一定是不好额事件,只表示特点事件的发生。
截尾:又称为终检或删失,指在发生终点事件之前,被观察对象的观测过程终止了。没有观察到所关心终点事件的发生。
特点:不完全信息(不知道确切的生存时间),但可知真实的生存时间不会短于现在观察的时间。
生存概率和死亡概率:
生存概率:某单位时段开始存活的个体,到该时段结束时仍存活的可能性。
死亡概率:表示某单位时段开始存活的个体,在该时段内死亡的可能性。
若观察时段相同,p+q=1
生存率与风险率:
生存率(survival rate)也即是生存函数指观察对象活过t个单位时段的可能性,记为S(t)。 如果没有删失数据,直接法计算生存率: 若有删失数据,须分段计算生存概率:
风险率(hazard rate)或风险函数表示t时刻存活的个体在t时刻的瞬时死亡风险。
生存率估计
非参数法估计的生存率主要有寿命表法(life table method)和乘积极限法(product limit method),前者适用于生存时间按区间分组的大样本资料,后者适用于仅含个体生存时间的小样本或者大样本资料。
分析思想:先求出各个时段的生存概率,然后根据概率乘法定理估计生存率。
1. 乘积极限法
又称为K-M法,乘积的含义:生存率等于生存概率的乘积;极限的含义:寿命表法中的时间区间长