集成学习

最新推荐文章于 2024-04-25 23:12:42 发布

米缸没米了

最新推荐文章于 2024-04-25 23:12:42 发布

阅读量527

点赞数 1

分类专栏：机器学习文章标签：集成学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_31307013/article/details/80452948

版权

集成学习分为序列化的Boosting和并行化的Bagging。Boosting通过调整样本权重或重采样，如AdaBoost、GBDT、XGBoost，连续训练基学习器，降低偏差。Bagging如随机森林通过随机抽样创建子集，训练基学习器，降低方差。随机森林在决策树训练中引入属性随机选择，增加多样性。

摘要由CSDN通过智能技术生成

1、目前的集成学习方法大致可分为两大类；

1）个体学习器间存在强依赖关系、必须串形生成的序列化方法。

常见的有： Boosting家族的： AdaBoost 、GBDT、XGBoost

2）个体学习器间不存在强依赖关系、可同时生成的并行化方法。

常见的有：Bagging家族的：随机森林(Random Forest)

2、Boosting家族：

算法思想：先从初始训练集训练出一个基学习器，再根据基学习器的表现对训练样本分布进行调整，使得先前基学习器做错的训练样本在后续受到更多的关注，然后基于调整后的样本分布来训练下一个基学习器；如此重复进行，直至基学习器数目达到事先指定的值T，最终将这T个学习器进行加权结合。

Boosting算法要求基学习器能对特定的数据分布进行学习。

1、这可通过‘重赋权重’实施，即在训练过程的每一轮中，根据样本分布为每个训练样本重新赋予一个权重。

2、对无法接受带权重的基学习器算法，则可通过"重采样法"来处理，即在每一轮学习中，根据样本分布对训练集重新进行采样，再用重采样而得的样本集对基学习器进行训练。

一般而言，这两种做法没有显著的优劣差别。需要注意的是，‘Boosting’算法在训练的每一轮都要检查当前生成的基学习器是否满足基本

最低0.47元/天解锁文章

米缸没米了

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
集成学习

1、目前的集成学习方法大致可分为两大类； 1）个体学习器间存在强依赖关系、必须串形生成的序列化方法。常见的有： Boosting家族的： AdaBoost 、GBDT、XGBoost 2）个体学习器间不存在强依赖关系、可同时生成的并行化方法。 ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。