easy ensemble 算法和balance cascade算法

最新推荐文章于 2024-08-26 20:17:55 发布

原创

最新推荐文章于 2024-08-26 20:17:55 发布 · 2.3w 阅读

·

11

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#machine-learning

本文探讨了Easy Ensemble和Balance Cascade两种机器学习算法。Easy Ensemble通过从多数类抽样并结合少数类构建训练集，训练Adaboost分类器。预测阶段，它使用所有弱分类器的预测结果和权重向量计算，而非简单的多数表决。相比之下，Balance Cascade算法类似，但通过调整分类器阈值控制错误的多数类样本比例，以确保在多次迭代后多数类样本数量减少至等于少数类。

看了一下easy ensemble 算法的matlab代码，发现之前的理解有问题

这里写图片描述

从上面的伪代码可以看出，easy ensemble每次从多数类中抽样出和少数类数目差不多的样本，然后和少数类样本组合作为训练集。在这个训练集上学习一个adaboost分类器。
最后预测的时候，是使用之前学习到的所有adaboost中的弱分类器（就是每颗决策树）的预测结果向量（每个树给的结果组成一个向量）和对应的权重向量做内积，然后减去阈值，根据差的符号确定样本的类别。

之前我的理解是根据每个adaboost的预测结果做多数表决，比如10个adaboost，有6个adaboost预测为少数类，那么这个样本就是少数类。显然，easy ensemble不是这样来实现的。

balance cascade算法的算法框架如下:
这里写图片描述

可以看出balance cascade算法和easy ensemble还是挺像的，差别就在第7步和第8步。

第6步，算法训练出一个分类器，然后在第7步调整分类器 $H_i$ 的阈值 $\theta_i$ 以保证分类器

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。