集成学习-Boosting

最新推荐文章于 2024-06-10 21:58:36 发布

schwamaths

最新推荐文章于 2024-06-10 21:58:36 发布

阅读量232

点赞数

分类专栏： AI 文章标签： boosting 机器学习算法

本文链接：https://blog.csdn.net/qq_40946639/article/details/119987856

版权

AI 专栏收录该内容

36 篇文章 0 订阅

订阅专栏

Boosting主要思想是通过多个模型去学习同一个数据集，从而得到多个简单的弱分类器模型，最后将这些模型组成一个性能十分强大的机器学习模型。
Valiant 和Kearns提出“弱可学习”和“强可学习”的概念。同时，Schapire证明出，强可学习和弱可学习是等价的。也就是一个概念可强学习的充分必要条件是这个概念可弱学习。

弱学习：识别错误率小于1/2（即准确率仅比随机猜测略高的学习算法）
强学习：识别准确率很高并能在多项式时间内完成的学习算法

大多数的boosting算法通过改变训练集的概率分布或者权重，针对不同的数据分布调用不同的学习器。那么对于boosting方法来说，最重要的问题就是1、每一轮的学习如何改变数据概率分布。2、如何将这些弱学习器组成一个强学习器。

AdaBoost

对于Adaboost来说，解决上述的两个问题的方式是：1. 提高那些被前一轮分类器错误分类的样本的权重，而降低那些被正确分类的样本的权重。这样一来，那些在上一轮分类器中没有得到正确分类的样本，由于其权重的增大而在后一轮的训练中“备受关注”。2. 各个弱分类器的组合是通过采取加权多数表决的方式，具体来说，加大分类错误率低的弱分类器的权重，因为这些分类器能更好地完成分类任务，而减小分类错误率较大的弱分类器的权重，使其在表决中起较小的作用。
现在，我们来具体介绍Adaboost算法：
假设给定一个二分类的训练数据集： $T=\left\{\left(x_{1}, y_{1}\right),\left(x_{2}, y_{2}\right), \cdots,\left(x_{N}, y_{N}\right)\right\}$ ，其中每个样本点由特征与类别组成。特征 $x_{i} \in \mathcal{X} \subseteq \mathbf{R}^{n}$ ，类别 $y_{i} \in \mathcal{Y}=\{-1,+1\}$ ， $\mathcal{X}$ 是特征空间，$ \mathcal{Y} $是类别集合，输出最终分类器$ G(x) $。 A d a b o o s t 算法如下： (1) 初始化训练数据的分布：$ D_{1}=\left(w_{11}, \cdots, w_{1 i}, \cdots, w_{1 N}\right), \quad w_{1 i}=\frac{1}{N}, \quad i=1,2, \cdots, N$
(2) 对于m=1,2,…,M

使用具有权值分布 $D_m$ 的训练数据集进行学习，得到基本分类器： $G_{m}(x): \mathcal{X} \rightarrow\{-1,+1\}$
计算 $G_m(x)$ 在训练集上的分类误差率 $e_{m}=\sum_{i=1}^{N} P\left(G_{m}\left(x_{i}\right) \neq y_{i}\right)=\sum_{i=1}^{N} w_{m i} I\left(G_{m}\left(x_{i}\right) \neq y_{i}\right)$
计算 $G_m(x)$ 的系数 $\alpha_{m}=\frac{1}{2} \log \frac{1-e_{m}}{e_{m}}$ ，这里的log是自然对数ln
更新训练数据集的权重分布
$\begin{array}{c} D_{m+1}=\left(w_{m+1,1}, \cdots, w_{m+1, i}, \cdots, w_{m+1, N}\right) \\ w_{m+1, i}=\frac{w_{m i}}{Z_{m}} \exp \left(-\alpha_{m} y_{i} G_{m}\left(x_{i}\right)\right), \quad i=1,2, \cdots, N \end{array}$
这里的 $Z_m$ 是规范化因子，使得 $D_{m+1}$ 称为概率分布， $Z_{m}=\sum_{i=1}^{N} w_{m i} \exp \left(-\alpha_{m} y_{i} G_{m}\left(x_{i}\right)\right)$

(3) 构建基本分类器的线性组合 $f(x)=\sum_{m=1}^{M} \alpha_{m} G_{m}(x)$ ，得到最终的分类器

$\begin{aligned} G(x) &=\operatorname{sign}(f(x)) \\ &=\operatorname{sign}\left(\sum_{m=1}^{M} \alpha_{m} G_{m}(x)\right) \end{aligned}$

schwamaths

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
集成学习-Boosting

Boosting主要思想是通过多个模型去学习同一个数据集，从而得到多个简单的弱分类器模型，最后将这些模型组成一个性能十分强大的机器学习模型。Valiant 和Kearns提出“弱可学习”和“强可学习”的概念。同时，Schapire证明出，强可学习和弱可学习是等价的。也就是一个概念可强学习的充分必要条件是这个概念可弱学习。弱学习：识别错误率小于1/2（即准确率仅比随机猜测略高的学习算法）强学习：识别准确率很高并能在多项式时间内完成的学习算法大多数的boosting算法通过改变训练集的概率分布或者权
复制链接

扫一扫