AdaBoost详解

最新推荐文章于 2024-01-01 11:12:18 发布

liuwei1206

最新推荐文章于 2024-01-01 11:12:18 发布

阅读量739

点赞数

分类专栏：数据挖掘与机器学习文章标签： AdaBoost 算法详解

本文链接：https://blog.csdn.net/jeryjeryjery/article/details/78966032

版权

数据挖掘与机器学习专栏收录该内容

19 篇文章 0 订阅

订阅专栏

本博客内容摘自李航老师的《统计学习方法》，加以一些整理。

AdaBoost算法

假定给定一个二分类的训练数据集：

T = {(x 1, y 1), (x 2, y 2), . . ., (x N, y N)}

$T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}$
其中，每个样本点由实力和标记组成。实例

xi∈X⊆Rn x i ∈ X ⊆ R n $x_i\in X\subseteq R^n$ (表示实数),标记

yi∈Y={−1,+1} y i ∈ Y = { − 1 , + 1 } $y_i\in Y=\{-1,+1\}$ ,即有两种标签的数据，用

{−1,+1} { − 1 , + 1 } $\{-1,+1\}$ 来表示这两种类别;

X X $X$ 是实例空间，

Y

$Y$ 是标记集合。AdaBoost算法利用以下算法，从训练数据中学习一系列弱分类器或基本分类器，并将这些弱分类器线性组合成一个强分类器。

AdaBoost描述:
输入:训练数据集 $T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}$ ，其中 $x_i\in X\subseteq R^n,y_i\in Y=\{-1,+1\}$ ;得到弱学习算法;
输出:最终分类器 $G(x)$

算法步骤:

(1)初始化训练数据的权值分布

D 1 = (w 11, . . ., w 1 i, . . ., w 1 N), w 1 i = 1 N, i = 1, 2, . . ., N (2.1)

$D_1=(w_{11},...,w_{1i},...,w_{1N}),w_{1i}=\frac{1}{N},i=1,2,...,N\quad\quad(2.1)$
D是用来描述各样本的权值分布的。

(2)对 $m=1,2,...,M$ ， $m$ 表示迭代的次数
(a)使用具有权值分布 $D_m$ 的训练数据集学习，得到基本分类器:

G m (x) : X ⟶ {- 1, + 1}

$G_m(x):X\longrightarrow \{-1,+1\}$
(b)计算

Gm G m $G_m$ 在训练数据集上的分类误差率

e m = P (G m (x i) \neq y i) = \sum i = 1 N w m i I (G m \neq y i) (2.2)

$e_m=P(G_m(x_i)\not= y_i)=\sum_{i=1}^Nw_{mi}I(G_m\not= y_i)\quad\quad(2.2)$
其中

I(Gm≠yi)={0,1} I ( G m ≠ y i ) = { 0 , 1 } $I(G_m\not= y_i)=\{0,1\}$ ，当分类正确时，等于0;分类错误时，等于1;

Gm(xi) G m ( x i ) $G_m(x_i)$ 表示第

m m $m$ 轮得到的弱分类器

G_{m}

$G_m$ 对第

i i $i$ 个样本

x_{i}

$x_i$ 的分类结果，

yi y i $y_i$ 表示第

i i $i$ 个样本的真实类别。注意计算误差率是用到了权重分布 $D$ 中的 $w_m$ 。
(c) 计算 $G_m(x)$ 的系数
$α m = 1 2 l o g 1 - e m e m (2.3)$ $\alpha_m=\frac{1}{2}log\frac{1-e_m}{e_m}\quad\quad(2.3)$
这里的对数是自然对数。可以发现，当错误率 $e_m$ 越大时, $a_m$ 越小。这个参数将会用在集成阶段。
(d)更新训练数据集的权值分布
$D m + 1 = (w m + 1, 1, . . ., w m + 1, i, . . ., w m + 1, N) (2.4)$ $D_{m+1}=(w_{m+1,1},...,w_{m+1,i},...,w_{m+1,N})\quad\quad(2.4)$
$w m + 1, i = w m i Z m e x p (- α m y i G m (x i)), i = 1, 2, . . ., N (2.5)$ $w_{m+1,i}=\frac{w_{mi}}{Z_m}exp(-\alpha_my_iG_m(x_i)),i=1,2,...,N\quad\quad(2.5)$
这里, $Z_m$ 是规范化因子，使得总的 $w_{m+1}$ 值和为1.
$Z m = \sum i = 1 N w m i e x p (- α m y i G m (x i)) (2.6)$ $Z_m=\sum_{i=1}^Nw_{mi}exp(-\alpha_my_iG_m(x_i))\quad\quad(2.6)$
它使得 $D_{m+1}$ 成为一个概率分布。

(3)构建基本分类器的线性组合

$f (x) = \sum m = 1 M α m G m (x) (2.7)$ $f(x)=\sum_{m=1}^M\alpha_mG_m(x)\quad\quad(2.7)$
错误率越低的弱分类器对应的 $\alpha$ 值越大，使其在表决中起较大的作用。
得到最终的分类器
$G (x) = s i g n (f (x)) = s i g n (\sum m = 1 M α m G m (x)) (2.8)$ $G(x)=sign(f(x))=sign\left(\sum_{m=1}^M \alpha_mG_m(x)\right)\quad\quad(2.8)$

对AdaBoost算法作如下说明:
步骤(1)假设训练数据集具有均匀的权值分布，即每个训练样本在基本分类器的学习中作用相同，这一假设保证第1步能够在原始数据上学习基本分类器 $G_1(x)$ .

步骤(2)AdaBoost反复学习基本分类器，在每一轮 $m=1,2,...,M$ 顺次地执行下列操作:
(a)使用当前分布 $D_m$ 加权的训练数据集，学习基本分类器 $G_m(x)$ .
(b)计算基本分类器 $G_m(x)$ 在加权训练数据集上的分类错误率:

$e m = P (G m (x i) \neq y i) = \sum G m (x i) \neq y i w m i (2.9)$ $e_m=P(G_m(x_i)\not=y_i)=\sum_{G_m(x_i)\not=y_i}w_{mi}\quad\quad(2.9)$
这里, $w_{mi}$ 表示第 $m$ 轮中第 $i$ 个实例的权值， $\sum_{i=1}^Nw_{mi}=1$ .这表明， $G_m(x)$ 在加权的训练数据集上的分类错误率是被 $G_m(x)$ 误分类样本的权值之和，由此可以看出数据权值分布 $D_m$ 与基本分类器 $G_m(x)$ 的分类错误率的关系。
(c)计算基本分类器 $G_m(x)$ 的系数 $\alpha_m,\alpha_m$ 表示 $G_m(x)$ 在最终的分类器中的重要性。由式子(2.3)可知，当 $e_m\leq \frac{1}{2}$ 时， $\alpha_m\geq 0$ ，并且 $\alpha_m$ 伴随着 $e_m$ 的减小而增大，所以分类误差率越小的基本分类器在最终分类器中的作用越大。
(d)更新训练数据的权值分布，为下一轮作准备。式子(2.5)可以写成：
$w m + 1, i = {w m i Z m e - α m, w m i Z m e α m, G m (x i) = y i G m (x i) \neq y i$ $w_{m+1,i}= \begin{cases} \frac{w_{mi}}{Z_m}e^{-\alpha_m}, & \text {$G_m(x_i)=y_i$} \\ \frac{w_{mi}}{Z_m}e^{\alpha_m}, & \text{$G_m(x_i)\not=y_i$} \end{cases}$
由此可知，被基本分类器 $G_m(x)$ 误分类样本的权值得以扩大，而被正确分类样本的权值却得以缩小。二者比较，误分类样本的权值被放大 $e^{2\alpha_m}=\frac{e_m}{1-e_m}$ 倍.因此，误分类样本在下一轮学习中起更大的作用。 不改变所给的训练数据，而不断改变训练数据的权值分布，使得训练数据在基本分类器的学习中起不同的作用，这是AdaBoost的一个特点。

步骤(3)线性组合 $f(x)$ 实现了 $M$ 个基本分类器的加权表决。系数 $\alpha_m$ 表示了基本分类器 $G_m(x)$ 的重要性，这里，所有 $\alpha_m$ 之和并不为1. $f(x)$ 的符号决定实例 $x$ 的类， $f(x)$ 的绝对值表示分类的确信度，利用基本分类器的线性组合构建最终分类器是AdaBoost的另一特点。

参考例子

注意，权值分布是在计算错误率 e <script type="math/tex" id="MathJax-Element-74">e</script>时起作用，公式(2.2)中。

确定要放弃本次机会？
福利倒计时
: :

立减 ¥
普通VIP年卡可用
立即使用

liuwei1206

关注关注

0
点赞

踩

0

收藏

觉得还不错? 一键收藏

0
评论

AdaBoost详解

本博客内容摘自李航老师的《统计学习方法》，加以一些整理。相关概念提升(boosting)方法是一种常用的统计学习方法，应用广泛且有效。在分类问题中，它通过改变训练样本的权重，学习多个分类器，并将这些分类器进行线性组合，提高分类的性能。对于分类问题而言，给定一个训练集，求比较粗糙的分类规则（弱分类器）要比求精确的分类规则（强分类器）容易得多。提升(booting)方法就是从弱学习算法出发，反复
复制链接

扫一扫

专栏目录

AdaBoost特征降维

08-16

特征降维是模式识别中重要的一步，从图像中提取的原始特征往往维度较高，需要对其降维处理。基于AdaBoost的特征降维是具有良好的特征选择能力，其对每一维特征训练若分离器，根据分类效果调整权重，并最终选择具有分类信息的特征组合。

AdaBoost算法特性

weixin_30325793的博客

12-18 378

Boosting算法提升算法是一种常见的统计学习方法,其作用为将弱的学习算法提升为强学习算法.其理论基础为:强可学习器与弱可学习器是等价的.即在在学习中发现了’弱学习算法’,则可以通过某些方法将它特生为强可学习器,这是数学可证明的.在分类学习中提升算法通过反复修改训练数据的权值分布,构建...

参与评论您还未登录，请先登录后发表或查看评论

获取AdaBoost模型的重要特征

qq_27802435的博客

11-06 4321

获取AdaBoost模型的重要特征模型训练之后，想要得到比较重要的特征，可以通过python的sklearn包来实现。 python实现代码如下所示： AdaBoostClassifier.py # -*- coding: utf-8 -*- import IOUtil as iou import numpy as np import pandas as pd from skle...

关于AdaBoost算法计算变量重要度的理解

fs01234的博客

06-26 2395

在看AdaBoost算法在R中的实现函数boosting时，发现该函数可以计算变量重要度(importance)，不仅感慨这个函数好强大，不但可以轻松调用AdaBoost这种集成学习算法，还提供了计算变量importance的功能。但是，importance究竟是如何算出来的，这个问题需要理解。在R中查找boosting函数的帮助文档，发现了一篇关于AdaBoost算法的开发资料[1]，里面提到...

【Python特征工程系列】教你利用AdaBoost模型分析特征重要性（源码）

最新发布

数据杂坛

01-01 1059

教你利用AdaBoost模型分析特征重要性（源码）

详解AdaBoost算法

12-23

**AdaBoost算法详解** AdaBoost（Adaptive Boosting）是一种集成学习方法，它通过迭代构建一系列弱分类器，并根据它们的性能分配不同的权重，最终组合成一个强分类器。这个算法由Yoav Freund和Robert Schapire在...

Adaboost算法详解

12-20

Adaboost 算法详解用于机器学习和深度学习

adaboost详解及matlab示例代码

04-09

Adaboost，全称为"Adaptive Boosting"，是一种集成学习方法，主要用于构建强分类器。这个算法通过迭代的方式组合多个弱分类器，形成一个具有高准确率的强分类器。在每次迭代中，Adaboost会赋予那些被弱分类器错误...

人脸检测中AdaBoost算法详解

08-28

人脸检测中AdaBoost算法详解人脸检测中AdaBoost算法是机器学习领域中的一种常用算法，主要用于人脸检测和识别。下面是该算法的详细解释。一、AdaBoost算法的基本概念 AdaBoost全称为Adaptive Boosting，意思为...

Adaboost

qq_38824043的博客

06-11 807

Adaboost 的基本认识集成学习的一种集成学习：建立多个模型，用某种方法，将多个模型联系在一起，使其输出结果优于单个模型 Adaboost算法：建立多个弱分类器，给每个弱分类器赋予权重，将这些弱分类器结合在一起得到一个强分类器。弱分类器的训练过程是串行的，上一个弱分类器训练完成后才能进行下一个弱分类器的训练。在每个弱分类器的训练过程中，需要关注上一个弱分类器分类错误的样本点。用当前训练的弱分类器来弥补上一个弱分类器分类结果的不足。 Adaboost 的推导首先假设有一个弱分类

Adaboost介绍与使用（实战）

shanshuyue的博客

11-12 2748

boosting AdaBoost是英文“Adaptive Boosting”（自适应增强）的缩写，它的自适应在于：前一个基本分类器被错误分类的样本的权值会增大，而正确分类的样本的权值会减小，并再次用来训练下一个基本分类器。同时，在每一轮迭代中，加入一个新的弱分类器，直到达到某个预定的足够小的错误率或达到预先指定的最大迭代次数才确定最终的强分类器。例子步骤 Adaboost训练过程1（二分类情况） Adaboost判断过程 Adaboost算法流程2 import numpy as np i

【机器学习】AdaBoost

littlemichelle

03-24 519

集成学习为什么要弱分类器，不用强学习器？集成学习：构建多个分类器（弱分类器），用某种策略将多个结果集成起来，作为最终结果。要求：每个弱分类器具备一定的“准确性”，分类器之间具备“差异性”。上述基于理论依据，基于每个弱（基）分类器的误差相互独立，但是解决相同问题，此假设不可能做到。因此集成学习的关键是，使得弱分类器之间“好而不同。” 集成学习大致分两大类：1）基分类器之间强依赖，必须串...

Adaboost/Xgboost学习及实践

神秘少年的博客

07-14 7215

前言博主最近因为一些杂事，最近忙于看CVPR17的相关进展，所以没有怎么进入深入的学习。近期准备写一下目前比较火的Xgboost算法。学习Xgboost算法之前，先普及一下数据挖掘的小知识作为参考。国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经

统计学习 Adaboost

一只老风铃

12-24 315

【基本原理】将多个弱分类器进行组合，组成一个强分类器；弱分类器：通常指代单层决策树，也就是决策树最简单的模型，只有一个特征判断点，选择一维特征来进行分类如二维坐标点中选取X=2为划分点，X>2为+1类 X<2为-1类一个强分类器由多个弱分类器迭代训练组合而成，每一次只训练一个弱分类器，之前训练好的分类器参与下一次分类，也就是第N次迭代将训练第N个弱分类器，而前面的...

Adaboost-分类

weixin_44611266的博客

09-12 379

##Adaboost-分类 from sklearn.ensemble import AdaBoostClassifier from sklearn.datasets import make_classification #1.导入数据 #data = pd.read_csv(’’) #2.数据预处理 #略，最终生成x_train,y_train,x_test #导入sklearn的数据集 x_t...

Adaboost分类器 haar特征整理

热门推荐

liulina603的专栏

03-04 2万+

Adaboost是一种迭代算法，其核心思想是针对同一个训练集训练不同的分类器(弱分类器)，然后把这些弱分类器集合起来，构成一个更强的最终分类器(强分类器)。其算法本身是通过改变数据分布来实现的，它根据每次训练集之中每个样本的分类是否正确，以及上次的总体分类的准确率，来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练，最后将每次训练得到的分类器最后融合起来，作为最后的决策分类

ML12:特征重要性 选取

smart boy

06-06 848

from __future__ import unicode_literals import numpy as np import sklearn.datasets as sd import sklearn.utils as su import sklearn.tree as st import sklearn.ensemble as se import matplotlib.pyplot as ...

adaboost原理（包含权重详细解释）

葫芦与瓢的博客

06-20 5347

1.1 Adaboost是什么 AdaBoost，是英文"Adaptive Boosting"（自适应增强）的缩写，由Yoav Freund和Robert Schapire在1995年提出。它的自适应在于：前一个基本分类器分错的样本会得到加强，加权后的全体样本再次被用来训练下一个基本分类器。同时，在每一轮中加入一个新的弱分类器，直到达到某个预定的足够小的错误率或达到预先指定的最大迭代次数

“相关推荐”对你有帮助么？

非常没帮助

没帮助

一般

有帮助

非常有帮助

提交