机器学习基础（五）集成学习

最新推荐文章于 2023-12-24 21:36:48 发布

Guanxiong He

最新推荐文章于 2023-12-24 21:36:48 发布

阅读量982

点赞数

分类专栏：机器学习基础文章标签：集成学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jkgghvfuj/article/details/121315857

版权

机器学习基础专栏收录该内容

20 篇文章 5 订阅

订阅专栏

集成学习方法

方法概述

集成学习（ensemble learning）方法通过构建并结合多个学习器并将之结合来解决一个问题。

在这里插入图片描述

其一般框架如上图所示：一个集成由多个基学习器（base learner）构成，基学习器由及分类算法在训练数据集上训练获得。

根据基学习器的种类，集成学习方法可以分为同质集成与异质集成，目前同质集成的应用更为广泛。

对集成学习方法进行分析：

参数角度，同质集成方法中同种基学习器本就是同过不同训练数据或不同超参数实现，因此就集成整体而言不需要超参数选择。
效果角度，集成学习通常具有比基学习器更强的泛化能力，可以将弱分类器通过组合形成精确度高的强学习器。
效率角度：由于使用集成学习不必像单一学习器一般考虑模型选择和参数调整，构建一个集成的计算代价未必高于构建一学习器；同时由于结合策略一般比较简单且基分类器可以并行处理，集成方法的推理代价也相对较小。

集成学习方法主要类别：

根据使用的基学习器是否相同
- 同质集成：基学习器种类相同，使用不同超参数或者学习策略得到不同的基学习器
- 异质集成：基学习器种类不同，使用策略将不同学习器的结果集成
- 同质集成应用相对更为广泛
根据具体集成的方法：
- Bagging（Bootstrap Aggregating 自助聚合）
  - 核心思路：对训练集采用自助采样方式得到训练子集，在子集上训练基学习器；使用分类任务投票，回归任务平均的方式聚合基分类器
- Boosting
  - 核心思路：串行训练一系列分类器，使得先前分类器分错的样本在后续收到更多的关注，将系列基分类器结合得到效果更好的强分类器。
- Stacking
  - 核心思想：使用原始数据集训练一级学习器，再以一基学习器的输出作为新的输入特征新联二级学习器

参考资料

【1】《统计学习方法》李航

【2】《强化学习》周志华

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。