分类算法 -- 集成学习bagging算法（理论介绍）以及bagging和Adaboost的区别

最新推荐文章于 2024-07-06 16:02:49 发布

weixin_43216017

最新推荐文章于 2024-07-06 16:02:49 发布

阅读量5.2k

点赞数 7

分类专栏：机器学习编程分类算法原理以及R&Python实现文章标签： bagging 集成学习 Adaboost

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43216017/article/details/87870915

版权

本文详细介绍了集成学习中的bagging算法，包括其简单的生成步骤、自助法原理和与Adaboost的区别。bagging算法通过有放回抽样创建多个数据集，训练得到的分类器权重相等，最后组合成最终分类器。相较于Adaboost，bagging在训练过程中没有主次之分，且组合时不加权。

摘要由CSDN通过智能技术生成

在前一篇中，我们介绍了集成学习中的Adaboost算法。本文中，我们将介绍集成学习中另一个很有名的算法----bagging算法。

算法步骤

bagging算法在原理上比Adaboost算法要更加简单。

Step 1： 通过自助法（有放回抽样）生成k个数据集，即在所有的样本中通过有放回的随机抽样，生成k个数据集。

Step 2： 对这k组数据集分别进行训练，从而得到k个分类器

Step 3： 将这k个分类器组合到一起，各个分类器的权重相同，从而得到最终的分类器。

在这里插入图片描述

算法详解

Step 1 值得关注的有

自助法详解
假设在原始数据集中共有n个样本，则我们选取的每一个数据集都要有n个数据。
通过有放回抽样的方式抽取数据，会导致数据集中有重复的数据，这是正常的。
在每一次抽取中，大概会有35%（计算过程详见上述文档：

最低0.47元/天解锁文章

weixin_43216017

关注

7
点赞
踩
35

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。