机器学习-集成学习2

最新推荐文章于 2024-05-16 08:29:31 发布

amorfatilily

最新推荐文章于 2024-05-16 08:29:31 发布

阅读量205

点赞数

分类专栏：机器学习文章标签：决策树机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41741485/article/details/105068414

版权

机器学习专栏收录该内容

35 篇文章 0 订阅

订阅专栏

装袋

装袋（bagging）即引导聚集算法（bootstrap aggregation），这种方法通过构造一系列弱分类器（weak classifier），然后以一定的方式将它们组合成一个强分类（strong classifier），可以有效降低结果方差，避免过拟合。
在这里插入图片描述

装袋流程图：

算法流程：

案例分析

进行5轮随机有放回抽样
对于每一轮抽样都生成一个弱分类器
最后我们使用投票将5个分类器的结果融合在一起得出最后的分类结果，最终的预测准确率达到90%，高于各个弱分类器的预测准确率。

特点
装袋通过降低弱分类器的预测方差，改善了整体的泛化性能
装袋的性能依赖于各个若分类的稳定性
由于每个样本被选中的概率相同，装袋并不侧重于数据集中的任何特例

随机森林

随机森林（Random Forest, RF），是一种利用集成学习中装袋的思想将多棵决策树集成的算法，其基本单元是决策树。
在这里插入图片描述
算法流程

随机森林学习算法效果要优于基于决策树的装袋学习算法。

特点

能够处理很高维度（feature很多）的数据，并且不用做特征选择
在训练完后，能够给出哪些特征比较重要
训练速度快
容易做成并行化方法，实现简单
泛化性能强，能抑制过拟合

提升

装袋（bagging）算法中，基分类器之间不存在依赖关系，基分类器可以并行生成；提升（boosting）算法中，基分类器之间存在强依赖关系，基分类器需要串行生成。
在这里插入图片描述
Boosting是一种可将弱学习器提升为强学习器的算法，基分类器串行生成，其中最著名的算法代表是AdaBoosting（Adaptive Boosting，自适应增强算法。）

AdaBoost训练过程（二分类）：

** Gradient Boosting**

在这里插入图片描述

损失函数

GBDT

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。