gbdt原文_GBDT学习笔记

最新推荐文章于 2024-01-18 21:02:36 发布

weixin_39928818

最新推荐文章于 2024-01-18 21:02:36 发布

阅读量232

点赞数

文章标签： gbdt原文

本文链接：https://blog.csdn.net/weixin_39928818/article/details/111752334

版权

GBDT（梯度提升决策树）是一种广泛应用于各种领域的集成学习算法，结合了梯度、Boosting和决策树的优势。文章介绍了GBDT的基本原理，包括加性增强和梯度增强思想，并详细讲解了GBDT在回归和分类任务中的具体实现，包括损失函数的选择和目标变量的更新。此外，还探讨了GBDT与XGBoost、LightGBM的区别。

摘要由CSDN通过智能技术生成

GBDT(Gradient Boosting Decision Tree，Friedman，1999)算法自提出以来，在各个领域广泛使用。从名字里可以看到，该算法主要涉及了三类知识，Gradient梯度、Boosting集成算法和 Decision Tree决策树。

该算法是GREEDY FUNCTION APPROXIMATION A GRADIENT BOOSTING MACHINE一文提出来的，它是一种基于 Gradient 的 Boosting Ensemble 模型。该算法底层基于 CART(GBDT 主要基于回归树) 和函数空间的梯度降算法，除了具有树模型的可解释性强、有效处理混合类型的特征、伸缩不变性(不需要对数据标准化)、对缺失值鲁棒等优点，还具有预测能力强、稳定性好等优势。相比于它的后继算法 XGboost/LightGBM ， GBDT 只要求模型损失函数一阶可导，凸或非凸都适用;而 XGboost/LightGBM 对损失函数的要求更为苛刻，必须一阶二阶都可导，而且要求损失函数为严格的凸函数。

GBDT 顾名思义，其基本原理包括两个核心算法思想，一个是加性增强；另一个是梯度增强。

加法模型：

最终的分类器函数形式如下：

其中，第t颗回归树，其对应的叶节点区域

。其中J为叶子节点的个数。

针对每一个叶子节点里的样本，我们求出使损失函数最小，也就是拟合叶子节点最好的的输出值

如下：

梯度增强：

大牛Freidman提出了用损失函数的负梯度来拟合本轮损失的近似值，进而拟合一个CART回归树。第t轮的第i个样本的损失函数的负梯度表示为

利用

可以拟合一颗CART回归树，得到了第t颗回归树，其对应的叶节点区域

。其中J为叶子节点的个数。