数据挖掘实战--二手车交易价格预测（五）模型融合

最新推荐文章于 2024-05-15 11:28:15 发布

CannonJia

最新推荐文章于 2024-05-15 11:28:15 发布

阅读量610

点赞数

分类专栏：数据挖掘实战文章标签：机器学习 python 数据挖掘

本文链接：https://blog.csdn.net/nonejia/article/details/105314357

版权

数据挖掘实战专栏收录该内容

4 篇文章

订阅专栏

模型融合目标

对于多次调参完成的模型进行模型融合

内容介绍

简单加权融合：
1）回归：（分类概率）：算术平均融合（Arithmetic mean），几何平均融合（Geometric mean）；
2）分类：投票（Voting)
3）综合：排序融合(Rank averaging)，log融合
4）Stacking融合
构建错层模型，利用预测结果再拟合
多树的提升方法

简单加权融合

利用算数平均，重新生成一个模型结果

def Weighted_method(test_pre1,test_pre2,test_pre3,w=[1/3,1/3,1/3]):
    Weighted_result = w[0]*pd.Series(test_pre1)+w[1]*pd.Series(test_pre2)+w[2]*pd.Series(test_pre3)
    return Weighted_result

## Init the Weight
w = [0.3,0.4,0.3]

## 测试验证集准确度
val_pre = Weighted_method(val_lgb,val_xgb,val_gbdt,w)
MAE_Weighted = mean_absolute_error(y_val,val_pre)
print('MAE of Weighted of val:',MAE_Weighted)

## 预测数据部分
subA = Weighted_method(subA_lgb,subA_xgb,subA_gbdt,w)

Stacking 融合

利用第二层的模型重新跑一次第一层生成的训练集、验证集和测试集进行预测。

## 第一层
train_lgb_pred = model_lgb.predict(x_train)
train_xgb_pred = model_xgb.predict(x_train)
train_gbdt_pred = model_gbdt.predict(x_train)

Strak_X_train = pd.DataFrame()
Strak_X_train['Method_1'] = train_lgb_pred
Strak_X_train['Method_2'] = train_xgb_pred
Strak_X_train['Method_3'] = train_gbdt_pred

Strak_X_val = pd.DataFrame()
Strak_X_val['Method_1'] = val_lgb
Strak_X_val['Method_2'] = val_xgb
Strak_X_val['Method_3'] = val_gbdt

Strak_X_test = pd.DataFrame()
Strak_X_test['Method_1'] = subA_lgb
Strak_X_test['Method_2'] = subA_xgb
Strak_X_test['Method_3'] = subA_gbdt

## 第二层
model_lr_Stacking = build_model_lr(Strak_X_train,y_train)
## 训练集
train_pre_Stacking = model_lr_Stacking.predict(Strak_X_train)
print('MAE of Stacking-LR:',mean_absolute_error(y_train,train_pre_Stacking))

## 验证集
val_pre_Stacking = model_lr_Stacking.predict(Strak_X_val)
print('MAE of Stacking-LR:',mean_absolute_error(y_val,val_pre_Stacking))

## 预测集
print('Predict Stacking-LR...')
subA_Stacking = model_lr_Stacking.predict(Strak_X_test)