流行病学和临床研究中,探索某疾病的发病原因或影响因素可以说是最常见的一种研究目的,而用于此研究的 logistic 回归,也成了流行病学和临床研究中广泛应用的方法。
上一期“临度科研:数据统计的理解和应用(九)线性回归”我们已经领略了多重线性回归在影响因素分析中的作用,但多重线性回归的因变量只能是定量变量。而实际中我们常会遇到对“发病与否”、“有无疗效”等二分类或多分类变量的影响因素分析,这种情况下多重线性回归已经不再适用了,logistic 回归则是合理的选择。
logistic 回归与多重线性回归很像,只是因变量的形式不同,它们的分析过程、分析策略都是类似的。从实际的角度来看,logistic 回归结果比多重线性回归具有更加明确的解释意义,它通过优势比(odds ratio,OR)这一广为人知的指标,使理论与实际完美地结合,使得疾病发生危险不再仅是一个理论层面的概念,而是一个可以理解的危险程度。
本次主要介绍的内容为logistic回归的分析策略。
一、logistic 回归简介
logistic 回归也称为 logit 模型,是对分类变量进行回归分析时最为常用的一种方法。与多重线性回归类似,logistic 回归也是研究自变量对因变量影响的方法,不过这里的因变量必须是分类变量。由于分类变量可以是二分类或多分类,因此logistic回归也有多种形式。
当