李宏毅ML+DL学习记录:ensemble

最新推荐文章于 2022-11-27 13:28:28 发布

缦旋律

最新推荐文章于 2022-11-27 13:28:28 发布

阅读量139

点赞数

分类专栏：李宏毅ML+DL

小陈一行一行地敲出来的啦~

本文链接：https://blog.csdn.net/weixin_41391619/article/details/104721277

版权

李宏毅ML+DL 专栏收录该内容

13 篇文章 1 订阅

订阅专栏

1.bagging

构成bagging的model是比较complex的，即比较容易overfit
它的思想是：一共有N个样本，做有放回抽样，抽出N个样本，如此重复几次，形成多组样本数同样为N的样本组。然后分别用这几组样本训练出多个分类器，然后把多个分类器的结果做平均（or voting）得到最终的结果。
ps:一般来说，在训练多个分类器的时候，属性也是随机抽取的。比如一共有20个属性，训练每个分类器的时候可能只用到10个（每个分类器的10个属性是随机抽的）

2.boosting

        构成boosting的model是比较简单的，即分类的效果并不好。
        boosting步骤：
        一开始，每个样本的权值（u）都一样，有放回地抽N个，记为resample_1，用resample_1训练出一个分类器f₁(x)，用f₁(x)去对所有N个样本（原本的样本）进行分类，计算error。
在这里插入图片描述

        分类正确的样本的权重变成u/d₁,分类错误的样本的权重变成u* d₁.
然后，重复以上步骤。
        最终得到T个分类器，那处理这T个分类器的结果得到最终的结果呢？
        一般采用加权平均的思想，即对T个分类结果进行加权平均，得到最终的分类结果，每个分类器的权重：
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
李宏毅ML+DL学习记录:ensemble

1.bagging构成bagging的model是比较complex的，即比较容易overfit它的思想是：一共有N个样本，做有放回抽样，抽出N个样本，如此重复几次，形成多组样本数同样为N的样本组。然后分别用这几组样本训练出多个分类器，然后把多个分类器的结果做平均（or voting）得到最终的结果。ps:一般来说，在训练多个分类器的时候，属性也是随机抽取的。比如一共有20个属性，训练每个分...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。