医学统计之Logistic回归分析
通常,在临床研究中会遇到多种类型的变量,如分类变量和连续变量。当遇到这类变量时,对应的因变量的取值会体现出三种可能,第一,具有连续型的;第二,属于二分类变量;第三,属于多分类变量。其中,二分类变量指的是只有两种可能的变量,如药物治疗效果的“有效”或“无效”、患者检验结果显示的“阴性”或“阳性”以及急救的“存活”或“死亡”等,多分类变量指的是具有多种状态的变量。因此,在面对这些具有多种状态的变量时,需对响应变量与其他变量之间的关系进行全面的考虑,但上期讲解的多元线性回归已然无法对此类变量进行处理,因此本期讲解的是能够解决这类问题的Logistic回归。
1● 概念界定●在医学研究中,Logistic回归是分析疾病与致病因子间联系的重要统计方法,属于一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等。以肿瘤病情分析为例,选择两组人群,一组是肿瘤组,一组是非肿瘤组,两组人群的体征与生活方式等均存在一定的差异性。因此因变量就为是否肿瘤,值为“是”或“否”,自变量就可以包括很多了,如年龄、性别