Bagging与Boosting基础逻辑

最新推荐文章于 2024-07-06 16:02:49 发布

BruceJust

最新推荐文章于 2024-07-06 16:02:49 发布

阅读量414

点赞数

分类专栏： Machine Learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42175217/article/details/105208871

版权

Machine Learning 专栏收录该内容

9 篇文章 2 订阅

订阅专栏

Bagging

基本思路：

有数据集N，进行有放回的抽取n个数据，N > n，反复K次，得到K组数据，

K组数据分别独立训练K个模型，然后再投票得到分类结果。

投票方法：

绝对多数投票法，某个类超过半数

相对多数投票法，票数最多的为预测结果，若多个同时最高，则从最高中随机一个

加权投票法，与加权平均类似

若是回归问题，则取平均数

bagging的应用：

bagging是为了降低variance

主要是针对容易过拟合的模型，多个模型投票可以降低过拟合风险。

特别针对稳定性较差的模型，稳定性越差，提升效果越明显。

比如决策树，只要树够深就一定会过拟合，于是随机森林就出现了。

随机森林在基础bagging的思路上还增加了特征随机。

Boosting

基本思路：

是一个迭代过程，每轮训练都是全量样本，每轮训练改变样本的权重，迭代T次后，把这T个模型再

按照训练过程中的权重进行加权得到最终model。

思路上会比bagging复杂些，boosting会减小再上一轮训练正确的样本的权重，增大错误样本在loss计算

中的权重。（对的残差小，错的残差大）

权重调整方式：

先给每一个样本同样的权重1，训练得到

然后调整权重，增加错误数据的权重，降低正确数据的权重，使得

正确率降低到0.5，然后把带着新的权重的样本来训练

如此迭代到停止。

boosting应用：

boosting是为了降低bias

与bagging抑制过拟合不同，boosting是为了增强拟合能力，服务目标是弱模型。

Adaboost是boosting的样本应用，并且每一次迭代过程的子训练本身是独立的，都是优化自己的log loss。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Bagging与Boosting基础逻辑

Bagging基本思路：有数据集N，进行有放回的抽取n个数据，N > n，反复K次，得到K组数据，K组数据分别独立训练K个模型，然后再投票得到分类结果。投票方法：绝对多数投票法，某个类超过半数相对多数投票法，票数最多的为预测结果，若多个同时最高，则从最高中随机一个加权投票法，与加权平均类似若是回归问题，则取平均数bagging的应用：bagg...
复制链接

扫一扫

专栏目录

BruceJust CSDN认证博客专家 CSDN认证企业博客

码龄6年

22: 原创

6万+: 周排名

102万+: 总排名

8万+: 访问

: 等级

815: 积分

46: 粉丝

113: 获赞

22: 评论

550: 收藏

私信

关注

热门文章

分类专栏

最新评论

离线迁移conda的python环境，方便私有化安装
CSDN-Ada助手: 非常感谢您分享离线迁移conda的python环境的经验，这篇博客对于想要私有化安装的用户来说非常有用。我觉得下一篇博客可以从如何管理conda环境入手，例如如何备份和恢复环境、如何分享环境等等。这样的技术文章对于其他用户也会非常有帮助，期待您的下一篇博客，相信会有更多读者受益。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
隐马尔可夫模型最详细讲解 HMM(Hidden Markov Model)
WCHYQ: 万分感谢！！！
tensorflow 2.0 自定义训练
CyrilSterling: 问题解决了吗我是多个输入一个输出没法直接调用model.ft里的acc表示准确度，这该怎么办啊
tensorflow 2.0 自定义训练
CyrilSterling: 问题解决了吗我是多个输入一个输出没法直接调用model.ft里的acc表示准确度，这该怎么办啊
tensorflow 2.0 自定义训练
CyrilSterling: 问题解决了吗我是多个输入一个输出没法直接调用model.ft里的acc表示准确度，这该怎么办啊

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。