有序Logistic回归
——因变量是有序分类变量的回归分析
【例】研究BMI相关的危险因素。资料如下:
表1 BMI相关危险因素原始资料
将BMI分成三类并赋值——正常(BMI=18-23)=1、偏高(BMI=24-27)=2、肥胖(BMI≥28)=3;性别赋值——1=男,0=女;年龄分组并赋值——20-29岁组=1、30-39岁组=2、40-49岁组=3;糖尿病状态赋值——有=1、无=0;职业分类赋值——轻体力劳动者=1、中体力劳动者=2、重体力劳动者=3。转换后资料如表2所示。
表2 原始资料的分类转换结果
敲黑板讲重点:
回归分析需要根据研究目的事先判断因变量(Y)。如本例数据,研究目的是分析哪些因素对BMI产生影响,而BMI分为正常、偏高、肥胖三类,为有序变量,因此采用的是有序logistic回归。如果研究目的是分析哪些因素对是否是糖尿病有影响,那么由于糖尿病是二分类变量,采用的应该是二分类logistic回归。
【操作】 1 输入原始数据图1 原始数据输入结果
2 调用命令图2 调用有序Logistic回归分析程序
3 定义变量图3 定义变量
敲黑板讲重点:
因子中的变量理论上可为任意类型变量,但对于分类变量logistic回归拟合效果更好。因子中如含有数值型变量需要的样本量大,建议的解决办法:数值型变量作为协变量进入模型拟合。等级变量既可作为因子,也可作为协变量,可根据实际情况选择。
4 其他设置在输出中选择“平行线检验”
图4 定义参考类别
敲黑板讲重点:
有序logistic回归给出的是因变量不同取值时的k-1个拟合模型,这些模型的回归系数相同,只是常数项不同。因此,模型必须符合平行原则。
【结果解读】系统首先给出“个案处理摘要”,接着给出模型拟合信息。
模型拟合信息是对拟合模型的检验,主要采用-2对数似然法。本例数据的检验结果是卡方值为44.120,P=0.003<0.05,模型成立。
接着,给出了拟合优度。两个拟合优度检验结果为P=0.668,P=0.587,均大于0.05,接受原假设,拟合效果好。
![a6085c7d89c915e44d1adff81c53239c.png](https://img-blog.csdnimg.cn/img_convert/a6085c7d89c915e44d1adff81c53239c.png)
然后,给出了伪R方。伪R方是评价混合效应模型的指标,越大越好。本例数据伪R方的考克斯•斯奈尔值为0.425,说明各因素对因变量的综合解释达到42.5%,效果尚可。
敲黑板讲重点:
在理论上,一般认为R方越大越好,最好大于0.7以上。但在实际医学案例的多因素分析中,一般很难达到。
然后是本次分析的重点,参数估算值表。
以BMI=3为参照,给出了BMI=1和BMI=2的两个方程,两个方程的回归系数一致,不同是常数。BMI=1时的常数为-1.170,BMI=2时的常数为1.064,但两个常数均没有意义(P>0.05)。
回归系数中,年龄、性别、是否是糖尿病对BMI有影响,职业对BMI没有影响(P>0.05)。其中,年龄的系数为1.162,P=0.043,年龄越大BMI越大;与女性相比,男性的系数为-2.039,P=0.012,男性的BMI比女性小;与糖尿病者相比,非糖尿病者的系数为-2.091,P=0.018,非糖尿病者BMI比糖尿病者小。
敲黑板讲重点:
Logistic回归分析很重要的是看优势比(OR),但SPSS24.0版本的有序Logistic回归分析尚不能计算OR值,需要将有意义的变量的回归系数带到EXP(B)函数中进行计算,即可得到。
最后是平行检验的结果:
P=0.905>0,05,接受原假设,拟合的模型符合平行原则,可以接受。
由于职业对BMI没有影响,不能纳入方程,因此,应剔除职业,纳入年龄、性别、是否糖尿病,再做一次回归分析。操作同上,结果如下:
经有序Logistic回归分析,BMI的大小与年龄、性别、是否糖尿病有关(P<0.05);年龄越大BMI越大,年龄大者BMI大的可能性是年龄小者的3.494(EXP(1.251))倍;与女性相比,男性BMI大的可能性小,男性BMI大的可能性是女性的0.118(EXP(-2.137))倍;与是糖尿病者相比,不是糖尿病者BMI大的可能性小,不是糖尿病者BMI大的可能性是糖尿病者的0.145(EXP(-1.933))倍。为此,可认为大龄、女性、有糖尿病等是BMI异常的三个危险因素。
原创人员:蔡晶
微信编辑:张俊