机器学习——梯度提升决策树（GBDT）

白天数糖晚上数羊

已于 2022-07-08 14:48:02 修改

阅读量9.9k

点赞数 12

分类专栏：机器学习文章标签：机器学习人工智能算法决策树

于 2022-04-02 16:30:38 首次发布

本文链接：https://blog.csdn.net/beiye_/article/details/123923178

版权

机器学习专栏收录该内容

8 篇文章 20 订阅

订阅专栏

一、提升树（Boosting Decision Tree）

提升树（Boosting Decision Tree）是以CART决策树为基学习器的集成学习方法。

GBDT提升树

提升树实际上就是加法模型和前向分布算法，表示为：

在前向分布算法第m步，给定当前的模型fm-1（x），求解：

得到第m棵决策树。不同问题的提升树的区别在于损失函数的不同，如分类用指数损失函数，回归用平方误差损失。

当提升树采用平方损失函数时，第m次迭代表示为：

称r为残差，所以第m棵决策树是对该残差的拟合。

要注意的是提升树算法中的基学习器CART是回归树，

二、GBDT概念

GBDT 的全称是 Gradient Boosting Decision Tree，梯度提升决策树，理解为梯度提升 + 决策树。GB代表的是Gradient Boosting，意为梯度提升，梯度是一种数学概念，一个函数的梯度方向是函数上升最快的方向，相反的，负梯度方向是函数下降最快的方向。GBDT中所有的树都是回归树，而不是分类树，也就是说DT独指Regression Decision Tree。

GBDT是通过采用加法模型（即基函数的线性组合），以及不断减小训练过程产生的残差来达到将数据分类或者回归的算法。

GBDT同样由许多决策树组成，但它于随机森林有许多不同。其中之一是GBDT中的树都是回归树。决策树分为两大类，分类树和回归树。分类树用于分类标签值，如将苹果单纯的分为好与坏的是分类树；回归树用于预测实数值，如能为苹果的好坏程度打个分就是回归树。另一个不同是每棵树都是建立在前一棵树的基础上实现的。

Friedman提出了利用最速下降的近似方法，利用利用损失函数的负梯度在当前模型的值，作为回归问题中提升树算法的残差的近似值，拟合一个回归树。