Adaboost - 新的角度理解权值更新策略

最新推荐文章于 2025-03-05 20:33:01 发布

拾毅者

最新推荐文章于 2025-03-05 20:33:01 发布

阅读量1.1w

点赞数 19

分类专栏： Machine Learning 文章标签：机器学习 Adaboost boosting 权值

本文链接：https://blog.csdn.net/dream_angel_z/article/details/52348135

版权

本文可移步至个人博客阅读：http://www.csuldw.com/2016/08/28/2016-08-28-adaboost-algorithm-theory/

关于Adaboost，在先前的一篇文章里，也介绍过它的步骤与实现，但理论上的推导未曾涉及。虽然Adaboost算法思想通俗易懂，但权值更新公式的由来，想必并非人人皆知。本文着重于从理论层面进一步阐述Adaboost，最终推导出迭代时的样本权值更新公式。

关于本文使用的数学符号的具体解释，见下表：

变量	符号	描述
训练数据	$(X, Y)$	第 $i$ 个样本为 $(x_i, y_i)$ ，其中 $x_i =( x_{i1}, x_{i2}, \cdots, x_{id} )$ ， $y_i \in \lbrace +1, -1 \rbrace$
错误率	$e$	第 $m$ 个弱分类器的错误率为 $e_m$
分类器的系数	$\alpha$	第 $m$ 个弱分类器的系数为 $\alpha_m$
样本权重向量	$D$	迭代值第 $m$ 次时的第 $i$ 个样本的权值为 $D_{m,i}$ ，初始阶段，所有样本的权重值均为 $\frac{1}{N}$
归一化因子	$Z$	迭代值第 $m$ 次的的归一化因子为 $Z_m$
组合分类器	f(x)	迭代值第 $m$ 次的组合分类器为 $f_m(x)$
最终分类器	G(X)	最终分类器为 $G(X) = sign(f_M(x))$

下面来看看Adaboost的算法思想与其权值的推导。

算法思想

关于Adaboost，它是boosting算法，从bias-variance（偏差-方差）的角度来看，boosting算法主要关注的是降低偏差。仔细想想便可理解，因为boosting算法每个分类器都是弱分类器，而弱分类器的特性就是high-bias & low variance（高偏差-低方差），其与生俱来的优点就是泛化性能好。因此，将多个算法组合起来之后，可以达到降偏差的效果，进而得到一个偏差小、方差小的泛化能力好的模型。另外，Adaboost的损失函数是指数损失 $L(y, f(x)) = e^{-yf(x)}$ 。为了掌握Adaboost的整个流程，我将其思想通过下图简单的进行了一番总结（由于此图是我使用LaTex编辑的，所以如有表达不妥的地方，还请读者指出）：

图一 Adaboost 算法

Adaboost算法可以归纳至三步，如下：

第一步：初始化每个样本的权重值为 $\frac{1}{N}$ ；
第二步：迭代 $M$ 次，每次都根据错误率 $e_m$ 不断修改训练数据的权值分布（此处需要确保弱学习器的错误率 $e$ 小于 $0.5$ ），样本权值更新规则为增加分类错误样本的权重，减少分类正确样本的权重；
第三步：根据每个弱学习器的系数 $\alpha_m$ ，将 $M$ 个弱学习器组合到一起，共同决定最终的学习结果，即 $G(X) = \sum_{m=1}^M \alpha_m G_m(x)$ .