任务描述:
用上一篇博客中评分最高的模型作为基准模型,和其他模型进行stacking融合,得到最终模型及评分果。
模型融合
表现最好的模型是GBDT和XGBoost。(以准确率和AUC值为判别标准)
模型评估代码如下:
#GBDT
#训练集预测标签和概率输出
train_gbdt_predict = clf_gbdt.predict(X_train)
train_gbdt_predict_pro = clf_gbdt.predict_proba(X_train)[:,1]
#测试集预测标签和概率输出
test_gbdt_predict = clf_gbdt.predict(X_test)
test_gbdt_predict_pro = clf_gbdt.predict_proba(X_test)[:,1]
#训练集评分
model_evaluation(y_train,train_gbdt_predict,train_gbdt_predict_pro)
#测试集评分
model_evaluation(y_test,test_gbdt_predict,test_gbdt_predict_pro)
结果:
====================训练集 accuracy: 0.856026450255 precision: 0.865979381443 recall: 0.503597122302 f1_score: 0.636846095527 roc_auc_score: 0.9093