一、适用范围
logistic回归是一种广义的线性回归分析模型,常用于疾病诊断、经济预测等领域,主要用途为寻找危险因素(寻找某一疾病的危险因素)、预测(不同自变量情况下,某病或某种情况的发生概率)和判别(判断某人属于某病或某种情况的概率有多大),在疾控项目中较多涉及寻找危险因素,因此,本文主要以寻找危险因素进行举例说明。
二、数据结构
logistic回归适用的因变量为二分类的分类变量或某事件的发生率,数值型变量。在寻找某疾病危险因素中为二分变量即患病与不患病;自变量为分类变量或连续变量,数据结构如下:
其中,年龄(LNL)为连续变量;性别为0=女,1=男;吸烟、饮酒和慢性阻塞性肺部疾病为0=否,1=是的二分变量;年龄(LN)为1=0-20岁,2=21-40岁、3=