Python中训练LR模型一般使用sklearn包,输出模型报告和其他机器学习方法一样。但从统计背景出发,想看更详细的报告,statsmodel包可以帮助实现。
1.训练模型
import statsmodels.api as sm
from statsmodels.stats.outliers_influence import variance_inflation_factor
#train样本上训练模型
y = trainData[y_name]
X = trainData[model_list]
X['intercept'] = [1] * X.shape[0]
LR = sm.Logit(y, X).fit()
2.模型报告
#LR自带的summary报告,直接输出到excel不方便
summary = LR.summary()
#查看VIF
X_m = np.matrix(X)
VIF_list = [variance_inflation_factor(X_m, i) for i in range(X_m.shape[1])]
#varname_list = [X.columns[i] for i in range(len(VIF_list))]
#计算标准化系数
X_new = X.drop(['intercept'],axis = 1)
X_new2 = X_new.apply(lambda x: (x - np.mean(x)) / np.std(x))
LR_N = sm.Logit(trainData[y_name], X_new2).fit()
#wald检验
wald_test = LR.wald_test