集成学习之Adaboost算法基本原理

最新推荐文章于 2024-05-05 19:16:43 发布

冷的太明显

最新推荐文章于 2024-05-05 19:16:43 发布

阅读量853

点赞数

分类专栏：机器学习文章标签：算法机器学习 adaboost adaboost算法详解

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/iyuanshuo/article/details/79625118

版权

机器学习专栏收录该内容

13 篇文章 2 订阅

订阅专栏

- - 什么是Adaboost
  - Adaboost算法

1. 什么是Adaboost？

AdaBoost算法是基于Boosting思想的机器学习算法，其中AdaBoost是Adaptive Boosting的缩写，AdaBoost是一种迭代型的算法，其核心思想是针对同一个训练集训练不同的学习算法，即弱学习算法，然后将这些弱学习算法集合起来，构造一个更强的最终学习算法。AdaBoost算法示意图1：

假设有 $n$ 个样本，为了构造出一个强的学习算法，首先需要选定一个弱学习算法，并利用同一个训练集不断训练弱学习算法，以提升弱学习算法的性能。在AdaBoost算法中，有两个权重，第一个数训练集中每个样本有一个权重，称为样本权重，用向量 $D$ 表示，初始的权重为 ${{D}_{1}}=({{w}_{11}},{{w}_{12}},...,{{w}_{1n}})$ ；另一个是每一个弱学习算法具有一个权重，用向量 $\alpha$ 表示。假设有 $n$ 个样本的训练集，初始时，设定每个样本的权重是相等的，即 $\frac{1}{n}$ ，利用第一个弱学习算法 ${{h}_{1}}$ 对其进行学习，学习完成后进行错误率 $\varepsilon$ 的统计2：

ε = N e r r o r N a l l

$\varepsilon =\frac{{{N}_{error}}}{{{N}_{all}}}$
其中，

Nerror ${N}_{error}$ 表示被错误分类的样本的数目，

Nall ${N}_{all}$ 表示所有样本的数目。因此，弱学习算法

h1 ${{h}_{1}}$ 的权重

α1 ${\alpha}_{1}$ 可以通过

ε $\varepsilon$ 求得：

α 1 = 1 2 ln (1 - ε ε)

${{\alpha }_{1}}=\frac{1}{2}\ln \left( \frac{1-\varepsilon }{\varepsilon } \right)$

在第一次学习完成后，需要重新调整样本的权重，以使得在第一分类中被错分的样本的权重，使得在接下来的学习中可以重点对其进行学习，所以需要更新训练的权值分布：

D m + 1 = (w m + 1, 1, w m + 1, 2, . . ., w m + 1, n)

${{D}_{m+1}}=({{w}_{m+1,1}},{{w}_{m+1,2}},...,{{w}_{m+1,n}})$

w m + 1, i = w m i Z m exp (- α m y i G m (x i)), i = 1, 2, . . ., n

${{w}_{m+1,i}}=\frac{{{w}_{mi}}}{{{Z}_{m}}}\exp \left( -{{\alpha }_{m}}{{y}_{i}}{{G}_{m}}\left( {{x}_{i}} \right) \right),i=1,2,...,n$

其中， ${\alpha }_{m}$ 表示第 $m$ 训练器的权重值， ${{G}_{m}}$ 代表第 $m$ 个分类器， $Z_t$ 是一个归一化因子：

Z m = \sum i = 1 n w m i exp (- α m y i G m (x i))

${{Z}_{m}}=\sum\limits_{i=1}^{n}{{{w}_{mi}}\exp \left( -{{\alpha }_{m}}{{y}_{i}}{{G}_{m}}\left( {{x}_{i}} \right) \right)}$

之后，使用更新后的权重值进行下一轮学习，直到 $M$ 轮结束，得到 $M$ 个弱学习方法 $\{{G_{1},G_{2},...,G_{M}}\}$ 及其权重

{α 1, . . ., α M}

$\{\alpha_{1},...,\alpha_{M}\}$ 。对新的分类数据，分别计算

M $M$ 个弱分类器的输出

{G1(X),G2(X),...,GM(X)} $\{{G_{1}(X),G_{2}(X),...,G_{M}(X)}\}$ ，最终的AdaBoost算法的输出结果为：

G (X) =sign(f (X))=sign (\sum m = 1 M α m G m (X))

$G\left( X \right)\text{=sign(}f(X)\text{)=sign}\left( \sum\limits_{m=1}^{M}{{{\alpha }_{m}}{{G}_{m}}(X)} \right)$

2. Adaboost算法

Adaboost基本的算法流程为3：

AdaBoost算法是一种具有很高精度的分类器，其实AdaBoost算法提供的是一种框架，在这种框架下，我们可以使用不同的弱分类器，通过AdaBoost框架构建出强分类器。

Machine Learning in Action. Peter Harrington ↩
http://blog.csdn.net/google19890102/article/details/46376603 ↩
A short introduction to boosting ↩

冷的太明显

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。