集成学习之Bagging和Boosting的简介

最新推荐文章于 2022-09-14 08:43:42 发布

Star_ACE

最新推荐文章于 2022-09-14 08:43:42 发布

阅读量498

点赞数

分类专栏：树算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34886403/article/details/82688772

版权

树算法专栏收录该内容

2 篇文章 0 订阅

订阅专栏

一、什么是集成学习
集成学习在机器学习算法中具有较高的准确率，不足的就是模型训练比较复杂，效率不高。

Boosting主要有：Adaboost、GBDT、XGBoost
Bagging主要有：Random Forest

集成学习的思想：
集成学习的主要思想是构建出多个弱分类器，它们共同组合对任务进行预测。核心思想就是如何训练多个弱分类以及如何将它们组合。

为什么有提出集成学习呢？
假如没有集成学习，那意味着在解决一任务时，我们必须训练出一个强分类器，构建一个强分类器非常复杂与困难。但是构建弱分类器就非常简单，所以有人提出通过一系列的弱分类器的共同作用来完成强分类器的作用

1、Bagging
在Bagging中，通过对训练样本的重新采用的方法得到不同的训练样本，在这些新的训练样本集上分别训练分类器，最终合并每一个分类器的结果，作为最终的学习结构。具体过程如下图所示。
这里写图片描述

在Bagging中，b个分类器是彼此相互独立，并具有相同的权重，所以可以把Bagging的方法理解成并行的。

2、Boosting
在Boosting算法中，各个分类器存在先后的顺序，同时，每个样本都有其的权重，初始时每个样本的权重是相等的。
算法流程：首先，第一个分类器对训练样本进行学习，当学习完成后，增大错误样本的权重，同时减少正确样本的权重，再利用第二个分类器对样本集（其样本权重以发生改变）进行学习，依次进行下去，最终得到b个学习器。同时，与Bagging不同，每一个分类器具有不同的权重。

这里写图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Star_ACE CSDN认证博客专家 CSDN认证企业博客

码龄9年

50: 原创

52万+: 周排名

100万+: 总排名

71万+: 访问

: 等级

3719: 积分

246: 粉丝

571: 获赞

59: 评论

2718: 收藏

私信

关注

热门文章

分类专栏

最新评论

OCR技术（文字定位与切割）
Diana_F: 博主，所以现在还是没有一个分割汉字效果不错的方法吗（哭泣）
残差结构详解
q-类星体: 感谢楼主分享，受益匪浅，这几天在炼丹侠租到了A100，使用很顺畅，关键有新人注册优惠券，希望能帮助楼主完成训练
残差结构详解
Shengheshan: 是博主写错了，应该把一个256改为64
机器学习中数据不均衡问题（分类类别数据不均匀）
陈嘿萌: 做好数据预处理、数据扩充、GAN生成样本、或者旋转、翻转等扩充样本数。
机器学习中数据不均衡问题（分类类别数据不均匀）
执金吾丶: 你好，想问一下你的问题解决了吗？如果解决的话，可以把解决办法传授一下么。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。