【AdaBoost算法】集成学习——AdaBoost算法实例说明

Yozu_Roo

已于 2023-05-29 10:28:29 修改

阅读量3.9k

点赞数 10

分类专栏：《机器学习》西瓜书笔记文章标签：机器学习集成学习 AdaBoost

于 2022-04-21 15:30:38 首次发布

本文链接：https://blog.csdn.net/qq_45955883/article/details/124320842

版权

《机器学习》西瓜书笔记专栏收录该内容

16 篇文章 48 订阅

订阅专栏

【AdaBoost算法】集成学习——AdaBoost算法实例说明

AdaBoost算法是数据挖掘十大算法之一，但是部分参考书上只给了该算法的数学推导过程，具体的流程并未详细举例加以解释，因此不利于学习者的掌握和领悟，通过查找相关资料，发现知乎有篇博文介绍的很是详细，并且附有具体实例加以理解。
（十三）通俗易懂理解——Adaboost算法原理

一、AdaBoost算法过程

给定训练数据集：（x1,y1）,(x2,y2)···(xn,yn)，其中yi属于{1，-1}用于表示训练样本的类别标签，i=1,…,N。Adaboost的目的就是从训练数据中学习一系列弱分类器或基本分类器，然后将这些弱分类器组合成一个强分类器。

相关符号定义：
在这里插入图片描述

Adaboost的算法流程如下：

在这里插入图片描述

相关说明：
在这里插入图片描述

综合上面的推导，可得样本分错与分对时，其权值更新的公式为：
在这里插入图片描述

二、AdaBoost实例讲解

例：给定如图所示的训练样本，弱分类器采用平行于坐标轴的直线，用Adaboost算法的实现强分类过程。
在这里插入图片描述

数据分析：

将这10个样本作为训练数据，根据 X 和Y 的对应关系，可把这10个数据分为两类，图中用“+”表示类别1，用“O”表示类别-1。本例使用水平或者垂直的直线作为分类器，图中已经给出了三个弱分类器，即：

在这里插入图片描述

初始化：

首先需要初始化训练样本数据的权值分布，每一个训练样本最开始时都被赋予相同的权值：wi=1/N，这样训练样本集的初始权值分布D1(i)：

令每个权值w1i = 1/N = 0.1，其中，N = 10，i = 1,2, …, 10，然后分别对于t= 1,2,3, …等值进行迭代（t表示迭代次数，表示第t轮），下表已经给出训练样本的权值分布情况：

在这里插入图片描述

第1次迭代 $t = 1$ ：

初试的权值分布D1为1/N（10个数据，每个数据的权值皆初始化为0.1），

$D 1 = [0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1]$

在权值分布 $D 1$ 的情况下，取已知的三个弱分类器 $h 1$ 、 $h 2$ 和 $h 3$ 中误差率最小的分类器作为第1个基本分类器 $H 1 (x)$ （三个弱分类器的误差率都是0.3，那就取第1个吧）
在这里插入图片描述

在分类器 $H 1 (x) = h 1$ 情况下，样本点“5 7 8”被错分，因此基本分类器 $H 1 (x)$ 的误差率为：
在这里插入图片描述

可见，被误分类样本的权值之和影响误差率 $e$ ，误差率 $e$ 影响基本分类器在最终分类器中所占的权重 $α$ 。

在这里插入图片描述

然后，更新训练样本数据的权值分布，用于下一轮迭代，对于正确分类的训练样本“1 2 3 4 6 9 10”（共7个）的权值更新为：

在这里插入图片描述

这样，第1轮迭代后，最后得到各个样本数据新的权值分布：

$D 2 = [1 / 14, 1 / 14, 1 / 14, 1 / 14, 1 / 6, 1 / 14, 1 / 6, 1 / 6, 1 / 14, 1 / 14]$

由于样本数据“5 7 8”被H1(x)分错了，所以它们的权值由之前的0.1增大到1/6；反之，其它数据皆被分正确，所以它们的权值皆由之前的0.1减小到1/14，下表给出了权值分布的变换情况：
在这里插入图片描述

可得分类函数： $f 1 (x) = α 1 H 1 (x) = 0.4236 H 1 (x)$ 。此时，组合一个基本分类器 $s i g n (f 1 (x))$ 作为强分类器在训练数据集上有3个误分类点（即5 7 8），此时强分类器的训练错误为：0.3

第二次迭代t=2：

在权值分布 $D 2$ 的情况下，再取三个弱分类器 $h 1$ 、 $h 2$ 和 $h 3$ 中误差率最小的分类器作为第2个基本分类器 $H 2 (x)$ ：

①　当取弱分类器 $h 1 = X 1 = 2.5$ 时，此时被错分的样本点为“5 7 8”：

误差率 $e = 1 / 6 + 1 / 6 + 1 / 6 = 3 / 6 = 1 / 2$ ；

②　当取弱分类器 $h 2 = X 1 = 8.5$ 时，此时被错分的样本点为“3 4 6”：

误差率 $e = 1 / 14 + 1 / 14 + 1 / 14 = 3 / 14$ ；

③　当取弱分类器 $h 3 = X 2 = 6.5$ 时，此时被错分的样本点为“1 2 9”：

误差率 $e = 1 / 14 + 1 / 14 + 1 / 14 = 3 / 14$ ；
在这里插入图片描述

因此，取当前最小的分类器 $h 2$ 作为第2个基本分类器 $H 2 (x)$
在这里插入图片描述

显然， $H 2 (x)$ 把样本“3 4 6”分错了，根据D2可知它们的权值为 $D 2 (3) = 1 / 14 ， D 2 (4) = 1 / 14 ， D 2 (6) = 1 / 14$ ，所以 $H 2 (x)$ 在训练数据集上的误差率：
在这里插入图片描述

这样，第2轮迭代后，最后得到各个样本数据新的权值分布：

$D 3 = [1 / 22, 1 / 22, 1 / 6, 1 / 6, 7 / 66, 1 / 6, 7 / 66, 7 / 66, 1 / 22, 1 / 22]$

下表给出了权值分布的变换情况：
在这里插入图片描述

可得分类函数： $f 2 (x) = 0.4236 H 1 (x) + 0.6496 H 2 (x)$ 。此时，组合两个基本分类器 $s i g n (f 2 (x))$ 作为强分类器在训练数据集上有3个误分类点（即3 4 6），此时强分类器的训练错误为：0.3

第三次迭代t=3:

在权值分布 $D 3$ 的情况下，再取三个弱分类器h1、h2和h3中误差率最小的分类器作为第3个基本分类器 $H 3 (x)$ ：

①　当取弱分类器 $h 1 = X 1 = 2.5$ 时，此时被错分的样本点为“5 7 8”：

误差率 $e = 7 / 66 + 7 / 66 + 7 / 66 = 7 / 22$ ；

②　当取弱分类器 $h 2 = X 1 = 8.5$ 时，此时被错分的样本点为“3 4 6”：

误差率 $e = 1 / 6 + 1 / 6 + 1 / 6 = 1 / 2 = 0.5$ ；

③　当取弱分类器 $h 3 = X 2 = 6.5$ 时，此时被错分的样本点为“1 2 9”：

误差率 $e = 1 / 22 + 1 / 22 + 1 / 22 = 3 / 22$ ；
在这里插入图片描述

因此，取当前最小的分类器h3作为第3个基本分类器 $H 3 (x)$ ：
在这里插入图片描述

这样，第3轮迭代后，得到各个样本数据新的权值分布为：

$D 4 = [1 / 6, 1 / 6, 11 / 114, 11 / 114, 7 / 114, 11 / 114, 7 / 114, 7 / 114, 1 / 6, 1 / 38]$

下表给出了权值分布的变换情况：

在这里插入图片描述

可得分类函数： $f 3 (x) = 0.4236 H 1 (x) + 0.6496 H 2 (x) + 0.9229 H 3 (x)$ 。此时，组合三个基本分类器 $s i g n (f 3 (x))$ 作为强分类器，在训练数据集上有0个误分类点。至此，整个训练过程结束。

整合所有分类器，可得最终的强分类器为：
在这里插入图片描述

这个强分类器 $H_{final}$ 对训练样本的错误率为0！

Yozu_Roo

关注

10
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
【AdaBoost算法】集成学习——AdaBoost算法实例说明

【AdaBoost算法】集成学习——AdaBoost算法实例说明AdaBoost算法是数据挖掘十大算法之一，但是部分参考书上只给了该算法的数学推导过程，具体的流程并未详细举例加以解释，因此不利于学习者的掌握和领悟，通过查找相关资料，发现知乎有篇博文介绍的很是详细，并且附有具体实例加以理解。（十三）通俗易懂理解——Adaboost算法原理一、AdaBoost算法过程给定训练数据集：（x1,y1）,(x2,y2)···(xn,yn)，其中yi属于{1，-1}用于表示训练样本的类别标签，i=1,…,N。A
复制链接

扫一扫