模型整合之模型堆叠——详细理解Stacking model

Stacking是一种有效的集成学习方法,通过结合多个模型的预测来创建更准确的预测。本文详细介绍了Stacking的概念,包括无Cross-Validation Stacking和Cross-Validation Stacking的工作流程,以及如何选择和评估Meta-Classifier。Stacking通过减少过拟合风险,提升了模型的泛化能力。
摘要由CSDN通过智能技术生成

详细理解Stacking model

如果你得到了10个不一样的model,并且每个model都各有千秋,这个时候你该怎么选?想必你一定是很为难吧,但通过集成方法,你可以轻松的将10个model合成为1个预测更精确的model。今天要介绍的就是众多集成方法里面的"Stacking"

什么是Stacking?

Leo Breiman 以他在分类和回归树以及随机森林方面的工作而闻名,他在 1996 年关于堆叠回归的论文 (Breiman 1996 b )中将堆叠形式化。尽管这个想法起源于(Wolpert 1992),名为“Stacked Generalizations”,但使用内部 k-fold CV 的现代堆叠形式是 Breiman 的贡献。

(Wolpert的文章获取:https://www.researchgate.net/publication/222467943_Stacked_Generalization)

然而,直到 2007 年,堆叠的理论背景才被开发出来,并且当算法采用了更酷的名称Super Learner (Van der Laan、Polley 和 Hubbard 2007)。此外,作者说明超级学习者将学习基础学习者预测的最佳组合,并且通常表现得与构成堆叠集成的任何单个模型一样好或更好。直到此时,堆叠工作的数学原因尚不清楚,堆叠被认为是一门黑色艺术。

**模型堆叠(Stacking)**是一种有效的集成方法,其中使用各种机器学习算法生成的预测被用作第二层学习算法的输入。该第二层算法经过训练,可以优化组合模型预测以形成一组新的预测。例如,当线性回归用作第二层建模时,它通过最小化最小二乘误差来估计这些权重。但是,第二层建模不仅限于线性模型;预测变量之间的关系可能更复杂,从而为采用其他机器学习算法打开了大门。

在这里插入图片描述

在这里插入图片描述

一般来说,Stacking由两层组成就够了。但完全可以由多层组成,其中一些层可以用作噪声的处理等等。其实不难发现,多层的Stacking与Deep learning是有点相似的。

All in all ,Stacking一般由两层组成。第一层:表现出色的基本模型;第二层:将第一层模型们的输出作为训练集得到的模型。第二层模型又被称作”meta-model

“,关键作用在于将第一层的所有模型的结果整合起来,进行输出。也就是说,第二层模型将第一层模型的输出作为特征进行训练。

在这里插入图片描述

不同种类的Stacking

在Stacking的实际应用中&

  • 13
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值