stacking和blending介绍

  • stacking

第一层:n个模型

数据量为M,首先把数据分为K份,一般为5,也就是5折;

为了方便理解,假设n=3, M=1000。测试集为300

对于第一个模型:

      在里面进行五折交叉验证,利用其中四折训练,预测另外一折,得到维度为:(200,1)

       同时预测测试集,维度(300,1)

       五折交叉完后,可以得到维度为:(1000,1)的向量

       测试集的预测值维度(300,5),取平均值得到(300,1)

对于其他模型也一样,最终可以得到(1000,3)的新训练集特征和(300,3)的测试集特征

第二层:LR或者其他模型

重新训练得到最终预测结果。

  • blending

第一层:n个模型

数据量为M,首先把数据分为两部分,55开,一半训练,一半预测;

假设n=3, M=1000。测试集为300

对于第一个模型:

       500个数据训练,然后预测500个验证集,得到(500,1)

       同时预测测试集,得到(300,1)

对于其他模型也一样,最终可以得到(500,3)的新训练集特征和(300,3)的测试集特征

第二层:LR或者其他模型

重新训练得到最终预测结果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值