模型融合作为kaggle等比赛的提分方法,你不知道可就落伍了,对于网上的大部分讲解个人看法是把一个简单的问题说的复杂了,反而不好理解,所以本文将通过简短的几句话讲述一下Stacking原理,文章最后附上kaggle对Stacking的一个案例,这样你就会完全掌握了,好的,下面开始
Staching原理
这里假设你的训练集有10000条,测试集有2500条,并且基学习器有10个(这个是你自己设定的),5折交叉验证,每一折8000训练集,2000验证集
基学习器1
第一折:基学习器1对8000训练集进行训练模型,对2000验证集进行验证,得到2000行1列的结果a1;对2500测试集进行训练得到2500行1列的结果b1.
第二折:基学习器1对8000训练集进行训练模型,对2000验证集进行验证,得到2000行1列的结果a2;对2500测试集进行训练得到2500行1列的结果b2…
第三折:基学习器1对8000训练集进行训练模型,对2000验证集进行验证,得到2000行1列的结果a3;对2500测试集进