集成学习之stacking

最新推荐文章于 2023-09-20 21:46:38 发布

凉白ex

最新推荐文章于 2023-09-20 21:46:38 发布

阅读量441

点赞数 2

分类专栏：学习记录文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/MLiangBai/article/details/116698403

版权

学习记录专栏收录该内容

4 篇文章 0 订阅

订阅专栏

集成学习之stacking

一、简介
二、个人理解

一、简介

stacking是基于blending的扩展。由blending原理可知，数据集被分成了三份，训练集和验证集其实都在起训练作用，只不过前者训练第一层分类器，后者训练第二层分类器。这样好吗？这样不好：首先，数据集划分的随机性会导致构建的模型不够稳健，也就是说，划分方式的改变可能会导致构建的模型差异很大；其次，划分后用作训练的数据集明显变小，得想办法再利用。stacking的思想就是把K折交叉验证引入训练过程，这样的话，第一层分类器和第二层分类器训练数据都会更加稳健、丰富。

二、个人理解

由于模型偏差来自于两方面：模型方差和模型偏差。blending的基本思想是提高模型复杂度减少模型偏差，但是训练数据集的变化和模型本身的变化都会造成模型方差的增加，而stacking则通过K折交叉验证的思路减少blending方差，从而提高集成模型精度。
直观来看，在数据集小的情况下，blending增加模型复杂度的同时可能会因数据不够带来相当大的方差，有可能得不偿失。。。

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。