提升树与GBDT的详细算法过程（建议收藏版）

最新推荐文章于 2024-05-19 16:45:21 发布

旅途中的宽~

最新推荐文章于 2024-05-19 16:45:21 发布

阅读量691

点赞数

分类专栏：机器学习系列文章文章标签：算法机器学习回归树梯度提升 GBDT

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wzk4869/article/details/126505567

版权

机器学习系列文章专栏收录该内容

77 篇文章 80 订阅

订阅专栏

GBDT的全称为：梯度提升决策树，英文为：（Gradient Boosting Decison Tree）。

提升树核心思想：拟合残差

怎么拟合残差呢？

首先第一步是使用boosting技术，对残差使用决策树进行拟合，比如我们常用的CART算法。第二步是使用加法模型，将拟合好的决策树相加。

一、提升树算法步骤

输入： $D=\{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)\}$

（1）初始化 $f_0(x)=0$ ；

（2）对于 $m=1,2,\cdots,M$ ，针对每一个样本 $x_i,y_i)$ ，计算残差：
$r_{mi}=y_i-f_{m-1}(x_i)\quad ,i=1,2,\cdots,N$

（3）利用 $\{(x_i,r_{mi})\}_{i=1,2,\cdots,N}$ 训练一个决策树（回归树），得到 $T(x;\Theta_m)$

（4）更新 $f_m(x)=f_{m-1}(x)+T(x;\Theta_m)$

（5）完成以上迭代，得到提升树:
$f_M(x)=\sum_{i=1}^MT(x;\Theta_m)$

其中， $M$ 表示决策树个数； $R_{mi}$ 表示残差。

二、GBDT算法步骤

输入：训练数据集 $D=\{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)\}$ ；损失函数为: $L (y, f (x))$ 。

（1）初始化:
$f_0(x)=\arg\min_{c}\sum_{i=1}^NL(y_i,c)$

（2）对于 $m=1,2,\cdots,M$ ，针对每一个样本 $x_i,y_i)$ ，计算残差：
$r_{mi}=-[\frac{\partial L(y_i,f(x_i))}{\partial f(x_i)}]_{f(x)=f_{m-1}(x)}\;,i=1,2,\cdots,N$

（3）利用 $\{(x_i,r_{mi})\}_{i=1,2,\cdots,N}$ 训练出第 $m$ 棵决策树（回归树） $T_m$ ，其中叶节点划分的区域为: $R_{mj}\;,j=1,2,\cdots,J$

（4）对于回归树 $T_m$ 的每一个叶结点，计算其输出值：
$c_{mj}=\arg\min_{c}\sum_{x_i\in R_{mj}}L(y_i,f_{m-1}(x_i)+c)\;,j=1,2,\cdots,N$

（5）更新:
$f_m(x)=f_{m-1}(x)+\sum_{j=1}^Jc_{mj}I(x\in R_{mj})$

（6）得到最终提升回归树：
$\hat{f(x)}=f_M(x)=\sum_{m=1}^M\sum_{j=1}^Jc_{mj}I(x\in R_{mj})$

输出：提升回归树 $\hat{f(x)}$

三、两者之间的区别

1.梯度提升回归树的残差使用负梯度来代替；

2.梯度提升回归树多了一步在叶子节点loss求最优值的计算，这里应该是为了降低优化误差，优化回归树的结果。

旅途中的宽~

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
提升树与GBDT的详细算法过程（建议收藏版）

提升树与GBDT的详细算法过程（建议收藏版）
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

旅途中的宽~ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。