Adaboost流程梳理

Asan28

于 2021-02-18 19:14:54 发布

阅读量157

点赞数

分类专栏：模型方法梳理文章标签：机器学习

本文链接：https://blog.csdn.net/Asan28/article/details/113851720

版权

1 篇文章 0 订阅

订阅专栏

一般地说，Adaboost中每个弱分类器都是单层决策树。

基本思想如下：

第一步使得所有样本点等权重，寻找最优的判定阈值 $\theta_1$ 和分类方法（方向，也即大于该阈值为+1还是小于该阈值为+1）。在该单层决策树下得到误差 $\epsilon_1$ 。使用 $\epsilon_1$ 可以计算出该分类器在最后所有分类器加权时的权重： $\alpha_1= \frac{1} {2} *log(\frac {1-\epsilon_1} {\epsilon_1})$ 。
接下来迭代数据权重，用第 $i$ 轮表示。针对单个样本点 $x$ 而言： $\omega_i=\omega_{i-1}*e^{-\alpha_{i-1}h_{i-1}(x)y_i} /\sum_x \omega_{i-1}*e^{-\alpha_{i-1}h_{i-1}(x)y_{i} }$ ,除以该分母意为归一化的权重。其中 $h_{i-1}(x)$ 为该点在上一次迭代后所得分类器对 $x$ 进行的预测lable。根据该数据权重计算新的 $\epsilon_i$ ，继而计算新的 $\alpha_i$ ，得到第 $i$ 个分类器在所有分类器中的权重。直到得到最终分类器。
使用最终分类器计算预测值： $=sign(\sum_i\alpha_ih_i(x))$

关注