logistic回归模型为:
对上面的模型进行变换,得到线性形式的logistic回归模型:
在二项分布族中,logistic回归是重要的模型。在某些回归问题中,响应变量是分类的,经常是要么成功,要么失败。
在R语言构建数据框时,应输入一列成功(响应)的次数和一列不成功(不响应)的次数,例如:
norell<-data.frame(
x=0:5,n=rep(70,6),success=c(0,9,21,47,60,63)
)
norell$Ymat<-cbind(norell$success,norell$n-norell$success)
glm.sol<-glm(Ymat~x,family=binomial,data=norell)
summary(glm.sol)
#预测并画出回归曲线
d<-seq(0, 5, len=100)
pre<-predict(glm.sol, data.frame(x = d))
p<-exp(pre)/(1+exp(pre))
norell$y<-norell$success/norell$n
plot(norell$x, norell$y); lines(d, p)
得到回归方程(变换后的)右侧为:-3.3010+1.2459X
于是回归方程为: