在生存分析中,探究生存时间的影响因素是一个重要的研究内容,通过KM和log-rank test检验的方法,只能够处理单个二分类因素的生存数据。当想探究多个因素或者离散型变量对生存时间的影响时,我们就需要借助于cox回归方法。cox回归的全称如下cox proportional hazards regression model
称之为cox等比例风险回归模型, 对应的公式如下
将上述公式进行log转换,可以变换成以下格式
这个公式和逻辑回归的公式就非常的接近了, cox回归其实是在线性回归和逻辑回归的基础上延伸而出的一种方法,将影响生存的多个因素当做回归方程中的自变量,将风险函数h(t)和h0(t)的比值当做因变量。
每个自变量对应的系数,如b1,b2这类的 ,称之为偏回归系数。当偏回归系数大于0时, 随着该自变量值的增加,风险增加,生存时间减少,当系数小于0时,则相反;等于0时,没有影响。
将exp(b)称之为hazard ratio, 简称HR。将偏回归系数转换成HR, 对应的关系如下HR = 1, 没有影响
HR > 1, 风险增加
HR < 1, 风险降低
在临床上,将HR>1的自变量称之为坏的预后因子,将HR<1的自变量称之为好的预后因子。通过survivalR包,可以轻松的实现cox回归分析,步骤如下
1. 准备生存数据
对于每个个体而言,其生存数据会出现两种情