机器学习--模型融合

stacking 和 blending

blending:

数据集分为train和test,对于model_i,对train做fold=5的CV,其中四份做训练数据,另外一份作为val数据,得出模型model_i_j,然后对val预测生成向量v_i_j,对test数据预测生成向量t_i_j,使用同样的方法五次,把所有的train都预测完,将5份向量concat对应生成t_i和v_i。

每个模型都能生成这样的两组向量,一个是训练集的,一个是测试集的(测试集在同一个模型预测多次后取平均),有多少个模型就能生成多少维的向量。

然后在顶层的模型,比如LR或则线性模型对v向量进行训练,生成的模型对t向量进行预测。

stacking:

将数据划分为train,test,然后将train划分为不相交的两部分train1和train2,使用不同的模型对train1训练,对train2和test进行预测,生成两个1维的向量,有多少个模型就生成多少维的向量。

第二层使用前面模型对train2生成的向量和label作为新的训练集,使用LR或者其他模型训练一个新的模型来预测test生成的向量。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值