梯度提升树（GBDT）算法原理详细总结

最新推荐文章于 2025-02-09 09:21:58 发布

天才厨师1号

最新推荐文章于 2025-02-09 09:21:58 发布

阅读量9.4k

点赞数 11

本文链接：https://blog.csdn.net/weixin_40449129/article/details/103417853

版权

本文详细介绍了梯度提升树（GBDT）算法，从基础的决策树开始，深入到提升树（Boosting Tree）概念，然后重点讲解了GBDT在回归和分类问题上的应用，包括残差近似和负梯度作为残差的计算方法。GBDT作为一种强大的机器学习方法，既能处理分类任务也能处理回归任务，但训练过程难以并行化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

上篇我们对boosting家族中的Adaboost算法进行了总结，本篇我们来探讨传统的梯度提升树（Gradient Boosting Decison Tree）算法。梯度提升树被认为是统计学习中性能最好的方法之一。
梯度提升树（GBDT）全称为Gradient Boosting Decison Tree，顾名思义，包含两部分内容：Gradient Boosting和Decison Tree。本篇我们首先Decison Tree进行简要回顾；然后探讨提升树算法；再重点探讨回归与分类问题对应的GBDT算法；最后对梯度提升树算法优缺点进行简单的总结。

1）Decision Tree

在决策树（Decision Tree）算法原理总结中我们了解到，决策树的基本结构（如下图），决策树由节点和有向的边组成，节点按所处在决策树的位置可以分为根节点，中间节点和叶子节点。其中每个节点代表一个属性，每个分支代表一个决策（规则），每个叶子代表一个结果（分类值或连续值）。
在这里插入图片描述
决策树根据选择最优特征的标准不同，可以分为ID3，C4.5，CART决策树，其中CART决策树是前面两种算法的改进。CART决策树既可以处理分类任务，又可以处理回归任务，但决策树存在容易过拟合的缺点。因此，有了提升模型的泛化能力的随机森林算法。
那么，有没有其他的一种方法，在不改变原有模型的参数结构基础上提升模型的泛化能力呢？
既然不能更改原来模型的参数，那么意味着必须在原来模型的基础之上做改善，正好可以利用boosting的思想对决策树进行提升。这就是我们下面要探讨的提升树算法（Boosting Tree）。

2）Decision Tree Ensemble——提升树（Boosting Tree）

如果我们选择以决策树为boosting框架的基学习器，那么这便是提升树（boosting tree）。对于分类问题决策树是二叉分类树，对于回归问题决策树是二叉回归树。
在AdaBoost算法原理详细总结我们解释了，boosting方法采用加法模型与前向分布算法。因此，提升树模型可以表示：
$f_M(x)=\sum_{m=1}^Mg_m(x)$
其中， $g_m(x)$ 表示第 $m$ 颗决策树， $M$ 表示为决策树的颗数。

对于数据集 $D=\left\{ (x_i,y_i) \right\}^n_{i=1}$ ， $x_i\in R^d$ ，提升树训练的目标就是最小化损失 $\sum_{i=1}^n L(y_i,f_M(x_i))$ ，即
$argmin\sum_{i=1}^n L(y_i,f_M(x_i))=argmin\sum_{i=1}^nL(y_i,\sum_{m=1}^Mg_m(x))$
对于不同问题的提升树算法，主要区别在于使用的损失函数不同。对于分类问题，损失函数一般有对数损失和指数损失；对于回归问题，损失函数一般有平方误差损失，绝对值损失，Huber损失。
对于二元分类情况下，采用指数损失时，提升树变成基学习器为分类树的Adaboost算法，可参考上篇AdaBoost算法原理详细总结第4部分。
下面我们探讨回归问题提升算法。
首先确定初始提升树 $f_0(x)=0$
根据前向分步算法，第 $m$ 步的模型为：
$f_m(x) = f_{m-1}(x) + g_m(x)$
在 $m$ 次迭代中，算法的目标是找到一个基学习器 $g_{m}(x)$ 使得损失最小，即：
$argmin\sum_{i=1}^n L(y_i,f_{m-1}(x_i)+g_m(x))$
生成第 $m$ 颗决策树 $g_m(x)$ 。
当采用平方误差损失时，决策树拟合的就是残差。
$L(y,f_{m-1}(x)+g_m(x))$
$y - f_{m-1}(x)-g_m(x))^2$
$r-g_m(x))^2$
其中， $r=y-f_{m-1}(x)$ 为模型拟合数据的残差。所以，对于回归问题的提升树算法，只需要拟合当前模型的残差，即 $\left\{(x_1,y_1-f_{m-1}(x_1)), (x_2,y_2-f_{m-1}(x_2)),...(x_n,y_n-f_{m-1}(x_n)\right\}$ 。

下面对回归问题提升树算法过程进行总结：