adaboost.M1与adaboost.M2差别比较

最新推荐文章于 2025-03-05 20:33:01 发布

tyh70537

最新推荐文章于 2025-03-05 20:33:01 发布

阅读量1w

点赞数 5

分类专栏：有效性检验文章标签： adaboost M2 adaboost算法详解 M1 集成学习

本文链接：https://blog.csdn.net/tyh70537/article/details/76675098

版权

有效性检验专栏收录该内容

4 篇文章

订阅专栏

三种算法的差别

adaboost是由Yoav Freund和Robert E. Schapire 首先提出来的一种用于二分类问题的集成方法，紧接着出现的adaboost.M1将二分类扩展到多分类问题，而adaboost.M2不仅可以处理多分类问题，还引入了置信度的概念，进一步扩展了adaboost算法。

adaboost的简单介绍

这里写图片描述
由

H (x) = s i g n (\sum t = 1 T α t h t (x))

$H(x)=sign(\sum_{t=1}^{T}\alpha_th_t(x))$ 可知
adaboost采用的集成方式是对基分类器的结果进行加权求和，如果结果大于0则样本被分为正类，如果结果小于0则样本被分为负类。
adaboost算法要做的就是每次迭代过程中，赋予被错误分类的样本更大的权重，从上图的步骤10可以看出：

D t + 1 (i) = {D t (i) * e - α t D t (i) * e α t i f h t (x i) = y i, i f not . (1)

$D_{t+1}(i)=\left\{\begin{array}{ll} D_t(i)*e^{-\alpha_t}&\text{$if$ $h_t(x_i)=y_i$},\\ D_t(i)*e^{\alpha_t}&\text{$if$ not}. \end{array}\right.\tag{1}$
如果一个样本被上一个分类器正确分类，那么它的权重将乘以

e−αt(e−αt∈(0,1)) $e^{-\alpha_t}(e^{-\alpha_t}\in(0,1))$ ,
如果这个样本被上一个分类器错误分类，那么它的权重将乘以

eαt(e−αt>1) $e^{\alpha_t}(e^{-\alpha_t}>1)$ 。
也就是说错误分类的样本权值相对于正确分类的样本权值扩大了

e2αt $e^{2\alpha_t}$ 倍，而

e2αt=1−ϵtϵt $e^{2\alpha_t}=\frac{1-\epsilon_t}{\epsilon_t}$

adaboost.M1

这里写图片描述
与前面提到的原版adaboost不同，adaboost.M1适用于多分类问题，为此，adaboost.M1对算法进行了一些必要的修改。不同之处在于：

一

$H(x)$ 的形式发生了一些变化，没有使用符号函数 $sign()$ ,但作用并没有发生实质的变化，任然可以看成是及基分类器对输出结果进行投票，而且基分类器的权重实质上也没有变化，依然是 $ln(\frac{1-\epsilon_t}{\epsilon_t} )$

二

对比第十步可以发现，adaboost.M1对权值更新函数做了一些调整以适应多分类的问题。权值更新规律如下：
如果一个样本被上一个分类器错误分类，那么它的权重不变，
如果这个样本被上一个分类器正确分类，那么它的权重将乘以 $\beta_t=\frac{\epsilon_t}{1-\epsilon_t}$
也就是说错误分类的样本权值相对于正确分类的样本权值扩大了 $\frac{1-\epsilon_t}{\epsilon_t}$ 倍，这与adaboost的权值更新法。