集成学习原理（简单易懂）

最新推荐文章于 2024-10-08 11:05:13 发布

努力生长的小草

最新推荐文章于 2024-10-08 11:05:13 发布

阅读量1.6k

点赞数

文章标签：数据分析机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_47205189/article/details/106482126

版权

一、概念

集成学习主要是指通过训练若干个个体学习器，通过一定的结合策略，形成一个强学习器

二、集成学习主要解决两个问题

如何得到若干个个体学习器
如何选择一种结合策略形成强学习器
同质学习器：指所有的学习器都相同，比如所有的学习器都是者决策树
异质学习器：指通过使用不同的学习器，比如对训练集使用逻辑回归、决策树等
同质学习器包含：bagging和boosting算法

三、bagging算法

bagging算法是指各学习器之间不存在强依赖关系，可以并行运行。
bagging算法是有放回的自助采样法。比如每次从训练集随机抽取1个样本，第二次再把第一个样本放回，再抽取第二个样本，依次类推，抽取m个样本。这样每次抽取的m个样本集都不同，可以得到不同的弱学习器
随机森林也是bagging算法，不同是使用的学习器是决策树以及除了样本随机以外还有特征随机。

四、boosting算法

boosting算法各学习器之间有强依赖关系，必须串行运行。代表的算法有AdaBoost和提升树。其中提升树运用做广泛的是梯度提升树。

五、模型融合

1.平均法：对用于回归问题，包括算术平均法、加权平均法
2.投票法：多用于分类问题
相对多数投票法，即少数服从多数
绝对多数投票法，除了少数服从多数外，票数还要过半
加权多数投票法，和加权平均法类似
3.stacking
stacking有2层学习器，第一层学习器训练集的预测结果作为第二层的输入，第一层学习器测试集的结果作为第二层的测试集。

附思维导图：
在这里插入图片描述

努力生长的小草

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。