什么是集成学习

最新推荐文章于 2022-10-17 08:19:52 发布

程序之巅

最新推荐文章于 2022-10-17 08:19:52 发布

阅读量359

点赞数

分类专栏：机器学习文章标签：集成学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhuguiqin1/article/details/122033639

版权

机器学习专栏收录该内容

18 篇文章 0 订阅

订阅专栏

集成学习

思想，将多个弱分类器按照某种方式组合起来，形成一个强分类器（三个臭皮匠赛过诸葛亮）
Bagging，把数据集通过有放回的抽样方式，划分为多个数据集，分别训练多个模型。针对分类问题，按照少数服从多数原则进行投票，针对回归问题，求多个测试结果的平均值
Stacking，通常是不同的模型，而且每个分类都用了全部训练数据，得到预测结果y1, y2, …, yk，然后再训练一个分类器 Meta Classifier，将这些预测结果作为输入，得到最终的预测结果
Boosting，与Bagging一样，使用的相同的弱学习器，不过是以自适应的方法顺序地学习这些弱学习器，即每个新学习器都依赖于前面的模型，并按照某种确定性的策略将它们组合起来
两个重要的 Boosting 算法：AdaBoost（自适应提升）和Gradient Boosting（梯度提升）
AdaBoost，使用前面的学习器用简单的模型去适配数据，然后分析错误。然后会给予错误预测的数据更高权重，然后用后面的学习器去修复
Boosting通过把一些列的弱学习器串起来，组成一个强学习器

Boosting与Bagging

结构上，Bagging是基分类器并行处理，而Boosting是串行处理
训练集，Bagging的基分类器训练是独立的，而Boosting的训练集是依赖于之前的模型
作用，Bagging的作用是减少variance，而Boosting在于减少bias
对于Bagging，对样本进行重采样，通过重采样得到的子样本集训练模型，最后取平均。因为子样本集的相似性，而且使用相同的弱学习器，因此每个学习器有近似相等的bias和variance，因为每个学习器相互独立，所以可以显著降低variance，但是无法降低bias
对于Boosting，采用顺序的方式最小化损失函数，所以bias自然是逐步下降，子模型之和不能显著降低variance

未完待续。。。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
什么是集成学习

集成学习思想，将多个弱分类器按照某种方式组合起来，形成一个强分类器（三个臭皮匠赛过诸葛亮）Bagging，把数据集通过有放回的抽样方式，划分为多个数据集，分别训练多个模型。针对分类问题，按照少数服从多数原则进行投票，针对回归问题，求多个测试结果的平均值Stacking，通常是不同的模型，而且每个分类都用了全部训练数据，得到预测结果y1, y2, …, yk，然后再训练一个分类器 Meta Classifier，将这些预测结果作为输入，得到最终的预测结果Boosting，与Bagg
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。