机器学习-深入理解Adaboost

最新推荐文章于 2020-01-17 14:44:22 发布

yz930618

最新推荐文章于 2020-01-17 14:44:22 发布

阅读量383

点赞数 1

分类专栏：机器学习文章标签：机器学习 AdaBoost

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yz930618/article/details/76849886

版权

机器学习专栏收录该内容

17 篇文章 3 订阅

订阅专栏

如今，集成式学习方法由于其强大的泛化能力，得到了广泛的重视和应用。在上一个博客http://blog.csdn.net/yz930618/article/details/76802908中讲解了什么是集成学习以及其分类。有不懂什么是集成学习的可以先看看这篇。

Boosting系列算法里最著名算法主要有AdaBoost算法和提升树(boosting tree)系列算法。提升树系列算法里面应用最广泛的是梯度提升树(Gradient Boosting Tree)。那么本次将着重讲解并推导集成学习中boosting方法中的Adaboost算法。

Adaboost理论介绍

Boosting算法的工作机制是首先从训练集用初始权重训练出一个弱学习器1，根据弱学习的学习误差率表现来更新训练样本的权重，使得之前弱学习器1学习误差率高的训练样本点的权重变高，使得这些误差率高的点在后面的弱学习器2中得到更多的重视。然后基于调整权重后的训练集来训练弱学习器2.，如此重复进行，直到弱学习器数达到事先指定的数目T，最终将这T个弱学习器通过集合策略进行整合，得到最终的强学习器。　　

AdaBoost 是一种迭代算法，其核心思想是针对同一个训练集训练不同的分类器，即弱分类器，然后把这些弱分类器集合起来，构造一个更强的最终分类器。

Adaboost=Boost+损失函数是指数函数（基函数可以任意）

具体说来，整个Adaboost 迭代算法就3步：

初始化训练数据的权值分布。如果有N个样本，则每一个训练样本最开始时都被赋予相同的权值：1/N。
训练弱分类器。具体训练过程中，如果某个样本点已经被准确地分类，那么在构造下一个训练集中，它的权值就被降低；相反，如果某个样本点没有被准确地分类，那么它的权值就得到提高。然后，权值更新过的样本集被用于训练下一个分类器，整个训练过程如此迭代地进行下去。
将各个训练得到的弱分类器组合成强分类器。各个弱分类器的训练过程结束后，加大分类误差率小的弱分类器的权重，使其在最终的分类函数中起着较大的决定作用，而降低分类误差率大的弱分类器的权重，使其在最终的分类函数中起着较小的决定作用。换言之，误差率低的弱分类器在最终分类器中占的权重较大，否则较小。

AdaBoost算法描述如下,其中, ${y}_{i}\in {-1,1}$ ,f是真实函数：

这里写图片描述

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习-深入理解Adaboost

本文将深入理解AdaBoost算法
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。