AdaBoost算法详解及示例分析

最新推荐文章于 2023-12-23 10:26:26 发布

千暮云

最新推荐文章于 2023-12-23 10:26:26 发布

阅读量1.4k

点赞数

分类专栏：机器学习文章标签：机器学习集成学习 Adaboost算法 Boosting

本文链接：https://blog.csdn.net/qq_35570161/article/details/82288897

版权

本文详细介绍了AdaBoost算法，一种Boosting方法，用于将弱学习器提升为强学习器。通过加性模型、指数损失函数和分类器参数更新来构建强分类器。文章还提供了一个算法流程，并给出了MATLAB实现的代码示例。

摘要由CSDN通过智能技术生成

1 引言

目前集成学习主要分为两类，一是基学习器之间存在强依赖关系、其必须串行生成的序列化方法，二是基学习器之间没有非常强的依赖关系、可同时生成的并行化方法。前者代表的算法为Boosting，后者则为Bagging和“随机森林”(Random Forest)，本文着重讲解有关Boosting算法的具体内容及算例分析。

2 Boosting

Boosting是指将一系列弱学习器经过某种组合的方法提升为强学习器的算法，其基本思路如下：先在原始数据上训练出一个弱学习器（也称基学习器），再根据生成的基学习器改变原始数据的分布，使得后续的训练可以进一步关注到该基学习器出错的样本集。继续在经过上述改变的数据上训练下一个基学习器，如此重复进行数据的改变和基学习器的训练，直到所训练好的基学习器组合后的学习器可以达到分类要求。而其中最具代表性的便是AdaBoost算法[1]，下面将着重介绍该算法的具体原理以及实际运用。

图1：Boosting具体流程示意图

3 AdaBoost算法

3.1 加性模型

AdaBoost算法所使用的基于加性模型(additive model)的强学习器生成方法，所谓加性模型即是各基学习器的线性组合

f (x) = \sum m = 1 M β m b m (x; γ m) (1)

$f(x) = \sum_{m=1}^{M}\beta_{m}b_{m}(x;\gamma_{m})\tag{1}$
其中，

x x $x$ 为输入数据，

{β_{m}, γ_{m}}

$\{\beta_{m},\gamma_{m}\}$ 为模型参数，

bm(x;γm) b m ( x ; γ m ) $b_{m}(x;\gamma_{m})$ 为关于

x x $x$ 的二分类器

G_{m} (x; γ_{m}) : R^{K} \to {- 1, 1}

$G_{m}(x;\gamma_{m}):R^{K}\to\{-1,1\}$ 。而其中的

{ βm,γm} { β m , γ m } $\{\beta_{m},\gamma_{m}\}$ 参数是由所定义的损失函数所确定，其计算表达式如下：

< β * m, γ * m > M 1 = arg min {β m, γ m} m 1 \sum i = 1 N L (y i, \sum m = 1 M β m b m (x; γ m)) (2)

min β, γ \sum i = 1 N L (y i, β m b m (x i; γ)) (3)

$\min_{\beta,\gamma}\sum_{i=1}^{N}L(y_{i},\beta_{m} b_{m}(x_{i};\gamma))\tag{3}$

3.2 损失函数

在这里我们使用指数损失函数(exponential loss function)[2]来进行上述的优化操作，其定义如下

L (y, f (x)) = e - y f (x) (4)

$L(y,f(x))=e^{-yf(x)}\tag{4}$
所求得的强分类器

f(x) f ( x ) $f(x)$ 需使得指数损失函数达到最小，考虑到式(4)对

f(x) f ( x ) $f(x)$ 对偏导

\partial L ( y ( x ) , f ( x ) ) \partial f ( x ) = - e f (x) P (y (x) = 1 | x) + e f (x) P (y (x) = - 1 | x) (5)

$\frac {\partial L(y(x),f(x))}{\partial f(x)}=-e^{f(x)}P(y(x)=1|x)+e^{f(x)}P(y(x)=-1|x)\tag{5}$
令(5)式为0可得

f (x) = 1 2 ln P ( y ( x ) = 1 | x ) P ( y ( x ) = - 1 | x ) (6)

$f(x)=\frac{1}{2}\ln\frac{P(y(x)=1|x)}{P(y(x)=-1|x)}\tag{6}$
故有

s i g n (f (x)) = = s i g n (1 2 ln P ( y ( x ) = 1 | x ) P ( y ( x ) = - 1 | x )) {1, P (y (x) = 1 | x) > P (y (x) = - 1 | x) - 1, P (y (x) = 1 | x) < P (y (x) = - 1 | x) (7)

$\begin{eqnarray*} sign(f(x))&=&sign(\frac{1}{2}\ln\frac{P(y(x)=1|x)}{P(y(x)=-1|x)})\\&=&\begin{cases}1,P(y(x)=1|x)>P(y(x)=-1|x)\\-1,P(y(x)=1|x)<P(y(x)=-1|x)\end{cases}\tag{7} \end{eqnarray*}$
从上式便可以看出，若指数损失函数达到最小则分类错误率也将到达最小值。因此，由于指数损失函数具有更好的数学性质（例如是连续可微函数），我们将使用该损失函数代替0/1损失函数作为优化对象。

3.3 分类器参数更新

根据分类器的加性特征我们有

f m (x)

最低0.47元/天解锁文章

千暮云

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
AdaBoost算法详解及示例分析

1、引言目前集成学习主要分为两类，一是基学习器之间存在强依赖关系、其必须串行生成的序列化方法，二是基学习器之间没有非常强的依赖关系、可同时生成的并行化方法。前者代表的算法为Boosting，后者则为Bagging和“随机森林”(Random Forest)，本文着重讲解有关Boosting算法的具体内容及算例分析。2、BoostingBoosting是指将一系列弱学习器经过某种组合的方...
复制链接

扫一扫

专栏目录