数据:顾客对软饮料购买意向。
上篇logistic在建立模型的过程中,通过模型系数的显著性检验,来逐渐筛选变量,从而建立合理的模型;本篇基于Adaptive-lasso方法来首先进行变量的筛选,同时结合数据的特点,数据量样本太少,适合该方法的使用。所以本篇基于该方法来建立logistic模型。
部分数据:
data <- read.csv("softdrink.csv",header = T)
source("lasso.adapt.bic2.txt")
out1 <- lasso.adapt.bic2(x=data[3:8],y=data$Choice)
结果显示,筛选出Calories,Fruits这两个变量,其他的变量的系数都被压缩到0,所以只有这两个变量进入模型。
进而建立logistic模型,雷同:https://blog.csdn.net/liuzhilu/article/details/80356016