【Python机器学习】利用AdaBoost元算法提高分类性能——基于错误提升分类器的性能

最新推荐文章于 2024-09-11 21:05:16 发布

zhangbin_237

最新推荐文章于 2024-09-11 21:05:16 发布

阅读量323

点赞数 8

分类专栏： Python机器学习文章标签：机器学习算法 python 分类人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39407597/article/details/140921627

版权

Python机器学习专栏收录该内容

209 篇文章 1 订阅

订阅专栏

能否使用弱分类器和多个实例俩构建一个强分类器？这是个有趣的理论问题。

这里的“弱”意味着分类器的性能比随机猜测要略好，但是也不会好太多。这就是说，在二分类情况下弱分类的错误率会高于50%，而“强”分类器的错误率将会降低很多。AdaBoost算法即脱胎与上述理论问题。

AdaBoost是adaptive boosting（自适应boosting）的缩写，其运行过程如下：训练数据中的每个样本，并赋予其一个权重，这些权重构成了向量D。一开始，这些权重都初始化成相等值。首先在训练数据上训练出一个弱分类器并计算该分类器的错误率，然后在同一数据集上再次训练弱分类器。在分类器的第二次训练中，将会重新调整每个样本的权重，其中第一次分对的样本的权重将会降低，而第一次分错的样本的权重将会提高。为了从所有弱分类器中得到最终的分类结果，AdaBoost为每个分类器都分配了一个权重值alpha，这些alpha值是基于每个弱分类器的错误率进行计算的。其中错误率 $\varepsilon$ 的定义为：(未正确分类的样本数目)/(所有样本数目)。

而alpha的计算公式为：

$\alpha =\frac{1}{2}ln\left ( \frac{1-\varepsilon }{\varepsilon } \right )$

计算出alpha值之后，可以对权重向量D进行更新，以使得那些正确分类的样本的权重降低而错分样本的权重升高。D的计算方法如下：

如果某个样本被正确分类，那么该样本的权重更改为：

$D_{i}^{(t+1)}=\frac{D_{i}^{(t)}e^{-\alpha }}{Sum(D)}$

如果某个样本被错分，那么该样本的权重更改为：

$D_{i}^{(t+1)}=\frac{D_{i}^{(t)}e^{\alpha }}{Sum(D)}$

在计算出D之后，AdaBoost又开始进入下一轮迭代，AdaBoost算法会不断地重复村里和调整权重的过程，直到训练错误率为0或者弱分类器的数目达到用户的指定值为止。

关注

8
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
【Python机器学习】利用AdaBoost元算法提高分类性能——基于错误提升分类器的性能

AdaBoost是adaptive boosting（自适应boosting）的缩写
复制链接

扫一扫

专栏目录

zhangbin_237 CSDN认证博客专家 CSDN认证企业博客

码龄7年

334: 原创

5547: 周排名

5193: 总排名

25万+: 访问

: 等级

6586: 积分

2590: 粉丝

3181: 获赞

21: 评论

2386: 收藏

私信

关注

热门文章

分类专栏

最新评论

【Python机器学习】非均衡分类问题
ha_lydms: 非常不错的技术领域文章分享，解决了我在实践中的大问题！博主很有耐心，写了这么实用有效的分享，值得收藏点赞。
【Python机器学习】神经网络的组成
全栈小5: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰，图文并茂，详略得当，三连支持，期待博主持续输出好文!【【Python机器学习】神经网络的组成，博主这篇文章，值得一看】
【Python机器学习】神经网络的组成
东境物语: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章内容丰富，涵盖了很多实用的知识点。非常感谢博主的分享，期待博主能够继续输出这样优质的好文。
【Python机器学习】FP-growth算法——从一棵FP树中挖掘频繁项集
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619258339。
【Python机器学习】模型评估与改进——带交叉验证的网格搜索
Kwan的解忧杂货铺@新空间代码工作室: 博主的文章总是如一盏明灯，为我解惑指路，你的博文总是让我拓展了视野，增长了见识，每篇博客都是知识的瑰宝，我真的很喜欢你的风格，感谢你一直以来的无私奉献。非常感激你的专业知识传授。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。