上一期介绍了多元线性回归分析的SAS实现,本打算介绍多元线性相关分析,有读者留言期待Logistic回归,那我们今天就开始介绍Logistic回归的数学模型、基本原理、分析步骤。
一、Logistic回归模型
分析例题:研究血红素(HAEM)与4种微量元素钙(CA)、铁(FE)、铜(CU)、锌(ZN)的关系。
(一)Logistic回归的数学模型及其基本原理
上两期介绍的多元线性回归模型在定量数据分析中是最常用的多因素统计分析方法,但是当因变量是分类变量时,多元线性回归就不适用了。我们先来回顾下多元线性回归模型:
式11-2中,因变量y是一个定量观察值。某事件发生的概率是不同于y值,概率的取值只能是从0到1。如果用线性回归模型来估计概率时,会出现估计值小于0或大于1的情况,从而对结果的解释带来困难。因此,在分析分类变量时,通常采用的一种统计方法是对数线性模型的一种特殊形式——Logistic回归模型。设某事件在各影响因素X1,X2,…,Xm的作用下发生的概率为P,不发生的概率为1-P,定义:
这叫作P的logistic变换,其中P/(1-P)是发生的概率与不发生概率的比值,logitP是比值的自然对数,式10-2中,只有0
式11-4是logistic线性回归方程,将该方程变换为以P为因变量的logistic曲线回归方程如下:
如果令x=(x1,x2,x3,…,xk)’,b=(b1,b2,b3,…,bk),可以得到以下logistic回归模型:
二、Logistic回归分析的步骤