有序分类logistic回归
正如字面理解,包含两个方面:一是有序性,如调研中常用的满意度常用李克特量表,即有序的因变量;二是logistic分类,如1代表优秀、2代表良好、3代表一般等等。
因变量为分类变量,且分类间有次序关系,针对因变量为分类型数据的情况应该选用Logistic回归,故应采用有序多分类的Logistic回归分析模型进行分析。
常应用的方向为:空气污染预测、医学类研究、心理学研究、满意度等定量研究。
本文分为五个步骤来进行有序分类logistic回归。
第一步:相关性分析 |
---|
chart.Correlation(data,histogram= TRUE,pch=19)
第二步:进行有序分类Logistic回归模型拟合,检验模型是否收敛,同时得到有序分类logistic回归模型中截距和回归系数的最大似然估计值 |
---|
fit01<-polr(factor(y1)~x1+x2+x3+x4+x5+x6,data=data)summary(fit01)
第三步:对有序分类Logistic回归模型中的各个自变量回归系数进行显著性检验 |
---|
drop1(fit01,test="Chi")
第四步,检验有序Logistic回归模型进行检验,是否存在统计学意义 |
---|
fit01a<-polr(factor(y1)~1,data=data)
fit01b<-polr(factor(y1)~ x1+x2+x3+x4+x5+x6,data=data)
anova(fit01a,fit01b)
第五步,预测有序Logistic回归模型拟合得到的值,然后将预测值与观察值进行对比,检验模型的预测效果 |
---|
pred.data<-predict(fit01)
n<-table(data01$y1,pred.data);n
Percantage<-c(n[1,1]/sum(n[1,]),n[2,2]/sum(n[2,]),n[3,3]/sum(n[3,]))
rbind(n,Percantage)
文/唏颜 一个偶尔三分钟、会耍代码的小白~ 请珍惜我的整理,转载请联系作者获得授权,并标注“唏颜”这个小白~