GBDT 算法：原理篇

最新推荐文章于 2024-10-03 22:05:43 发布

「已注销」

最新推荐文章于 2024-10-03 22:05:43 发布

阅读量285

点赞数 1

分类专栏：学习提升机器学习文章标签：机器学习 GBDT

本文链接：https://blog.csdn.net/qq_15245487/article/details/100144165

版权

GBDT是梯度提升决策树，通过结合多个弱决策树形成强学习器。本文介绍了GBDT的原理，包括决策树分类、GBDT概念、目标函数、加法模型和泰勒公式。此外，讨论了GBDT算法的优化过程，如通过残差学习树结构，以及Xgboost与GBDT的区别。

摘要由CSDN通过智能技术生成

GBDT 算法：原理篇

tags: 学习笔记机器学习 GBDT

GBDT 是常用的机器学习算法之一，因其出色的特征自动组合能力和高效的运算大受欢迎。
这里简单介绍一下 GBDT 算法的原理，后续再写一个实战篇。

1、决策树的分类

决策树分为两大类，分类树和回归树。

分类树用于分类标签值，如晴天/阴天/雾/雨、用户性别、网页是否是垃圾页面；

回归树用于预测实数值，如明天的温度、用户的年龄、网页的相关程度；

两者的区别：

分类树的结果不能进行加减运算，晴天 + 晴天没有实际意义；
回归树的结果是预测一个数值，可以进行加减运算，例如 20 岁 + 3 岁=23 岁。
GBDT 中的决策树是回归树，预测结果是一个数值，在点击率预测方面常用 GBDT，例如用户点击某个内容的概率。

2、GBDT 概念

GBDT 的全称是 Gradient Boosting Decision Tree，梯度提升决策树。

要理解 GBDT，首先就要理解这个 B(Boosting)。

Boosting 是一族可将弱学习器提升为强学习器的算法，属于集成学习（ensemble learning）的范畴。Boosting 方法基于这样一种思想：对于一个复杂任务来说，将多个专家的判断进行适当的综合所得出的判断，要比其中任何一个专家单独的判断要好。通俗地说，就是"三个臭皮匠顶个诸葛亮"的道理。

基于梯度提升算法的学习器叫做 GBM(Gradient Boosting Machine)。理论上，GBM 可以选择各种不同的学习算法作为基学习器。GBDT 实际上是 GBM 的一种情况。

为什么梯度提升方法倾向于选择决策树作为基学习器呢？(也就是 GB 为什么要和 DT 结合，形成 GBDT) 决策树可以认为是 if-then 规则的集合，易于理解，可解释性强，预测速度快。同时，决策树算法相比于其他的算法需要更少的特征工程，比如可以不用做特征标准化，可以很好的处理字段缺失的数据，也可以不用关心特征间是否相互依赖等。决策树能够自动组合多个特征。

不过，单独使用决策树算法时，有容易过拟合缺点。所幸的是，通过各种方法，抑制决策树的复杂性，降低单颗决策树的拟合能力，再通过梯度提升的方法集成多个决策树，最终能够很好的解决过拟合的问题。由此可见，梯度提升方法和决策树学习算法可以互相取长补短，是一对完美的搭档。

至于抑制单颗决策树的复杂度的方法有很多，比如限制树的最大深度、限制叶子节点的最少样本数量、限制节点分裂时的最少样本数量、吸收 bagging 的思想对训练样本采样（subsample），在学习单颗决策树时只使用一部分训练样本、借鉴随机森林的思路在学习单颗决策树时只采样一部分特征、在目标函数中添加正则项惩罚复杂的树结构等。