Boosting算法总览

最新推荐文章于 2024-07-12 10:45:15 发布

lzk_nus

最新推荐文章于 2024-07-12 10:45:15 发布

阅读量229

点赞数

分类专栏： Machine Learning 文章标签：算法 boosting 机器学习

本文链接：https://blog.csdn.net/qq_42791848/article/details/122372973

版权

Machine Learning 专栏收录该内容

22 篇文章 13 订阅

订阅专栏

Boosting

本章节讲解提升算法，主要是提升树，提升树实际上是采用加法模型和前向分步算法，并且以决策树为基学习器。下面我们就依次来介绍这几个概念

Additive Model

下面我们来看加法模型，加法模型的定义非常简单，其实就是所有基学习器的一个线性组合
$H(x)\ =\ \sum_{t=1}^{T}\alpha_{t}h_t(x)$
Boosting算法一种比较容易理解的推导方式就是基于加法模型。而加法模型的学习就是在已知损失函数 $L$ 的条件下，最小化损失函数得到最优的加法模型
$minimize\ \ \ \ \sum_{i=1}^{N}L(y_i,\ H(x_i)) \ \\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ =\sum_{i=1}^{N}L(y_i,\ \sum_{t=1}^{T}\alpha_{t}h_t(x))$

Forward Stepwise Algorithm

加法模型的优化目标非常的复杂，不能直接求解，因此采用前向分布算法。前向分布算法的步骤如下：

输入：数据集 $D$ ，损失函数 $L$ ，基学习器 $h (x)$
输出：加法模型 $H (x)$

(1) 初始化基学习器 $h_0(x) = 0$
(2) 对于$t=1,2,\dots,T $
(a) 极小化损失函数得到本轮最优基学习器及其权重 $(\alpha_t,\ h_t)\ = \ argmin_{\alpha, h} \sum_{i=1}^{N}L(y_i,\ h_{t-1}(x_i) +\alpha_th_t(x_i))$

(b) 更新 $h_t(x) \ =\ h_{t-1}(x) + \alpha_{t}h_t(x)$

(3) 得到加法模型： $H(x)\ =\ \sum_{t=1}^{T}h_t(x)$

基于以上的知识，我们就可以推导出很多的提升树模型，例如AdaBoost就可以解释称成模型为加法模型、损失函数为指数函数、学习算法为前向分布算法的二分类模型

Boosting Tree

提升树算法采用前向分步算法，首先确定初始提升树 $H_0(x)=0$ ，第 $t$ 步的模型为：
$H_t(x)\ =\ H_{t-1}(x)\ +\ T(x;\theta_t)$
其中， $T(x;\theta_t)$ 是 $t$ 时刻得到的基学习器（单棵决策树）。

提升树模型有很多，但其实也只是损失函数的不同，用于不同的任务。如分类任务常用指数损失函数或对数似然函数，回归任务常用均方误差损失或者绝对误差损失。

lzk_nus

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Boosting算法总览

Boosting本章节讲解提升算法，主要是提升树，提升树实际上是采用加法模型和前向分步算法，并且以决策树为基学习器。下面我们就依次来介绍这几个概念Additive Model下面我们来看加法模型，加法模型的定义非常简单，其实就是所有基学习器的一个线性组合H(x) = ∑t=1Tαtht(x)H(x)\ =\ \sum_{t=1}^{T}\alpha_{t}h_t(x)H(x) = t=1∑Tαtht(x)Boosting算法一种比较容易理解的推导方
复制链接

扫一扫