集成学习（二）：AdaBoost算法解释

最新推荐文章于 2023-07-25 21:34:05 发布

m_buddy

最新推荐文章于 2023-07-25 21:34:05 发布

阅读量347

点赞数

分类专栏：机器学习文章标签： AdaBoost

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m_buddy/article/details/79563680

版权

机器学习专栏收录该内容

34 篇文章 3 订阅

订阅专栏

1. 前言

在之前的博客中讲解了AdaBoost算法的原理，为了能够更加直观理解AdaBoost算法，常用的解释模型便是使用加法模型。

2. 加法模型解释

首先定义AdaBoost的加法模型为：

f (x) = \sum m = 1 M α m G m (x)

$f(x)=\sum_{m=1}^M\alpha_mG_m(x)$
其中

αm α m $\alpha_m$ 是基函数的系数，

Gm(x) G m ( x ) $G_m(x)$ 为基函数。则就可以使用指数函数定义损失函数

L (y, f (x)) = e x p (- y f (x))

$L(y,f(x))=exp(-yf(x))$
假设经过

m−1 m − 1 $m-1$ 次迭代之后得到的模型为:

f m - 1 (x) = f m - 2 (x) + α m - 1 G m - 1 (x) = α 1 G 1 (x) + \dots + α m - 1 G m - 1 (x)

$f_{m-1}(x)=f_{m-2}(x)+\alpha_{m-1}G_{m-1}(x)\\ =\alpha_{1}G_{1}(x)+\ldots+\alpha_{m-1}G_{m-1}(x)$
得到第

m m $m$ 次的迭代得到

α_{m}, G_{m} (x) 和 f_{m} (x)

$\alpha_m,G_m(x)和f_{m}(x)$

f m (x) = f m - 1 (x) + α m G m (x)

$f_m(x) = f_{m-1}(x)+\alpha_{m}G_m(x)$
目标是使前向分布算法得到的

αm,Gm(x)和fm(x) α m , G m ( x ) 和 f m ( x ) $\alpha_m,G_m(x)和f_{m}(x)$ 在训练数据集T上的指数损失函数最小化，即是

(α m, G m (x)) = a r g min a, m \sum i = 1 N e x p [- y i (f m - 1 (x i) + α G (x i))] = a r g min a, m \sum i = 1 N w m i e x p (α G (x i))]

$(\alpha_m, G_m(x))=arg\min_{a,m}\sum_{i=1}^Nexp[-y_i(f_{m-1}(x_i)+\alpha G(x_i))]\\ =arg\min_{a,m}\sum_{i=1}^Nw_{mi}exp(\alpha G(x_i))]$
其中

w m i = e x p (- y i f m - 1 (x i))

$w_{mi}=exp(-y_if_{m-1}(x_i))$
上式中最小化之后的

α∗m,G∗m(x) α m ∗ , G m ∗ ( x ) $\alpha_m^*, G_m^*(x)$ 就是AdaBoost算法得到的

αm,Gm(x) α m , G m ( x ) $\alpha_m,G_m(x)$ 。则对其进行求解就分为了两步，先求解

G∗m(x) G m ∗ ( x ) $G_m^*(x)$ ：

G * m (x) a r g min G \sum i = 1 N w m i I (y i \neq G (x i))

$G_m^*(x)arg\min_{G}\sum_{i=1}^Nw_{mi}I(y_i\neq G(x_i))$
之后求解

α∗m α m ∗ $\alpha_m^*$ ：

\sum i = 1 N w m i e x p (α G (x i))] = \sum y i = G m (x i) w m i e - α + \sum y i \neq G m (x i) w m i e α = (e α - e - α) \sum i = 1 N w m i I (y i \neq G (x i))

$\sum_{i=1}^Nw_{mi}exp(\alpha G(x_i))]\\ =\sum_{y_i=G_m(x_i)}w_{mi}e^{-\alpha}+\sum_{y_i\neq G_m(x_i)}w_{mi}e^{\alpha}\\ =(e^{\alpha}-e^{-\alpha})\sum_{i=1}^Nw_{mi}I(y_i\neq G(x_i))$
将已经求得的

G∗m(x) G m ∗ ( x ) $G_m^*(x)$ 带入上式，对

α α $\alpha$ 求导并使倒数为0，即可得到让目标函数最小的

α α $\alpha$

α * m = 1 2 l o g 1 + e m e m

$\alpha_m^*=\frac{1}{2}log\frac{1+e_m}{e_m}$
其中

em e m $e_m$ 是分类误差率：

e m = \sum N i = 1 w m i I ( y i \neq G ( x i ) ) \sum N i = 1 w m i

$e_m=\frac{\sum_{i=1}^Nw_{mi}I(y_i\neq G(x_i))}{\sum_{i=1}^Nw_{mi}}$
这里基函数权值系数的更新是与AdaBoost算法一致的，对于样本权值系数的更新是这样的

w m + 1, i = w m, i e x p (- y i α m G m (x))

$w_{m+1,i}=w_{m,i}exp(-y_i\alpha_mG_m(x))$

3. 参考

统计学习方法——李航

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。