个人理解:
1.stacking堆叠法,更像是在特征维度上扩展,使用不同的模型获得不同的特征,堆在一起获得新的输入特征。
2.blending融合法,更像是在特征的时间维度来多次开发特征,先被一套模型预测,得到的结果,作为另一套模型的输入,一直套娃,得到最终的输出。
stacking,自己的理解
可以打一个比方,你是一个公司的老板,现在有一个项目在招标,公司有五个部门,分别是算法,硬件,软件,营销,运营。
假设算法组有五个人,那么组长分工一下,每个人考量这个项目的一部分,各个部分之间没有重叠。组长根据算法组五个人的结果,来总结一下,在算法组看来,是否可以接这个项目。
老板问这个项目该不该接呢?各个部门有自己的判断,有点认为要接,有的认为不要接。最后老板对所有结果综合一下,比如投票。
在这个例子中,五个部门就是五个分类器,老板是最后一个综合考虑的分类器(也叫第二层分类器)。每个部门中,把项目化为成五个小部分,就是五折交叉验证,每个成员根据自己所看的部分来判断,每个部门完成第一次stacking。老板那里完成第二次stacking。
仅仅是自己的理解,可能有些偏颇,欢迎留言讨论。
blending,自己的理解