统计学习方法之Adaboost提升方法

最新推荐文章于 2024-09-01 11:13:59 发布

何如千泷

最新推荐文章于 2024-09-01 11:13:59 发布

阅读量112

点赞数

分类专栏：统计学习方法文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/qq_42735631/article/details/120922153

版权

11 篇文章 0 订阅

订阅专栏

AdaBoost算法

AdaBoost算法通过提高那些被前一轮弱分类器错误分类样本的权重，而降低那些被正确分类样本的权重，使得被错误分类样本受到后一轮的弱分类器的更大关注。

$输入：训练数据集T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}，其中x_i \in R^n，y_i \in \{-1, +1\}；；弱学习算法$

$输出：最终分类器 G (x)$

初始化训练数据的权重分布
$D_1=(w_{1,1},...,w_{1,i},...,w_{1,N}), \quad w_{1i}=\frac {1}{N}, \quad i=1,2,...,N$
对 $m = 1, 2, . . ., M$
- 使用具有权重分布 $D_m$ 的训练数据集学习，得到基本分类器
  $D_m(x) \rightarrow \{-1,+1\}$
- 计算 $G_m(x)$ 在训练集上的分类误差率
  $e_m=\sum_{i=1}^{N}P(G_m(x_i)\not=y_i)=\sum_{i=1}^{N}w_{mi}I(G_m(x_i)\not=y_i)$
- 计算 $G_m(x)$ 的系数
  $\alpha_m=\frac{1}{2}log\frac{1-e_m}{e_m}$
- 更新训练数据集的权重分布
  $D_{m+1}=(w_{m+1,1},...,w_{m+1,i},....,w_{m+1,N})$
  $w_{m+1,i}=\frac {w_{m,i}} {Z_m} exp(-\alpha_my_iG_m(x_i)), \quad i=1,2....,N$
  其中， $Z_m$ 是规范化因子，使 $D_{m+1}$ 成为一个概率分布
  $Z_m=\sum_{i=1}^Nw_{m,i}exp(-\alpha_my_iG_m(x_i))$
构建基本分类器的线性组合
$f(x)=\sum_{m=1}^M\alpha_mG_m(x)$
得到最终分类器
$G(x)=sign(f(x))=sign(\sum_{m=1}^M\alpha_mG_m(x))$

关注

专栏目录