一、模型简介
有序多分类logistic回归用于因变量为有序多分类的情况,如患者对药物的反应y共有三种情况:疗效差、一般和好。定义y=1(疗效差)、y=2(疗效一般)、y=3(疗效好)。
对于有序多分类logistic回归,模型将因变量的多个分类依次分割为多个二元logistic回归。如3种不同疗效的患者,分析时拆分为2个二元logistic回归,分别为 (1vs 2 3) 、(1 2 vs3)
logit(p1) =α1+β1*x1+β2*x2+…
logit(p1+p2) =α2+β1*x1+β2*x2+…
可以看到,有序多分类logistic回归的假设是,拆分后的几个二元logistic回归的自变量系数相等,仅常数项不等。因此,有序多分类的logistic回归模型中,必须进行平行线检验,即检验自变量系数是否相等;如果不满足平行线检验,可采用无序多分类logistic回归。
二、示例数据
假设有示例数据如下:因变量:满意度y=1/2/3,有序多分类;自变量:年龄age、文化程度edu、性别sex。
其中,age为连续变量,edu(1=初中及以下,2=高中,3=大专,4=本科,5=研究生);性别sex(1=男,2=女)。
三、SPSS的操作
1.在SPSS中选择“分析-回归-有序logistic回归”
2.将y选入“因变量”框
3.将连续变量age选入“协变量”框
4.将分类变量sex、edu选入“因子”框
5.通过“输出”,选择“平行线检验”
6.点击“继续”、“确定”
四、结果解读
首先是模型拟合信息,与只含截距的模型相比,拟合的模型具有统计学意义,即至少有一个自变量的偏回归系数不为零。
接下来,我们来看平行线检验,p值为0.177,不拒绝原假设,即自变量的回归系数相等,满足平行性检验,可以采用有序logistic回归。
然后,模型的参数估计。
阈值对应的两个估计值分别是拆分的2个二元logistic回归的常数项。位置中age、edu和sex对应的估计值即为自变量的系数。其中edu被拆分成了4个哑变量,以edu=5为参照。其中年龄的系数为-0.046,即在调整edu和sex的基础上,年龄每增加1岁,y的取值高一个等级的可能性是exp(-0.046)=0.955倍。