机器学习总结----融合模型Stacking

最新推荐文章于 2023-01-04 17:29:14 发布

小黎的学习总结

最新推荐文章于 2023-01-04 17:29:14 发布

阅读量1.4k

点赞数 2

文章标签：算法机器学习数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37820194/article/details/105220904

版权

本文介绍了机器学习中的Stacking融合模型，通过利用不同算法的优势，提高预测性能。文章详细阐述了Stacking的训练过程，特点，对基分类器的要求，以及为何在第二层通常使用简单分类器如LR。Stacking虽然训练速度较慢，但能有效防止过拟合，并通过L1正则化选择重要特征。

摘要由CSDN通过智能技术生成

本博客参考了：
https://blog.csdn.net/maqunfi/article/details/82220115
https://zhuanlan.zhihu.com/p/27493821

主要思路

stacking框架是集成了不同的算法，充分利用不同算法从不同的数据空间角度和数据结构角度的对数据的不同观测，来取长补短，优化结果

训练过程

1、划分数据集，比如我们有10000条训练集，2500条测试集，我们将训练集分成5分，每份2000条数据，一层的模型使用5折交叉验证，就是选4份作为训练集，一份做为验证集，这样我们可以得出5份不同的训练集和验证集来训练模型。如下图
在这里插入图片描述
2、将验证集的结果排在一块，就可以得到第二层的10000条训练数据，对于测试集，5个交叉验证训练出来的模型会有5份测试集的结果，我们对他进行求平均得到第二层的2500条测试集

3、假设我们要融合10个不同的模型，那么第二层我们会得到1000010维度的训练集，250010的测试集

4、我们用得到的数据训练第二层的模型，第二层的模型一般是比较简单的模型，比如说LR

Stacking特点

1、性能超群，比传统的机器学习效果要好很多
2、我们可以将集成好的知识放到简单的分类器上
3、可以在第二层加入正则项防止过拟合，而且不用过多的调参数和挑选特征。<

最低0.47元/天解锁文章

小黎的学习总结

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。