机器学习笔记之十三——对GBDT的疑问：GBDT的负梯度为什么近似于提升树的残差

最新推荐文章于 2022-10-31 16:07:18 发布

JAVA技术分享官

最新推荐文章于 2022-10-31 16:07:18 发布

阅读量3.1k

点赞数 2

分类专栏：机器学习文章标签： GDBT残差 GDBT负梯度

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35946969/article/details/86008354

版权

机器学习专栏收录该内容

26 篇文章 5 订阅

订阅专栏

先验知识：

提升树的优化目标： $\widehat{\Theta } = arg min\sum ^N_{i=1}L(y_i,f_{m-1}(x_i)+T(x_i;\Theta _m))$ ,其中yi为真实label， $f_{m-1}$ 为第m-1个模型， $T(x;\Theta_m)$ 为残差。

——公式来自李航《统计学习方法》P148

对于上述优化目标，L即损失函数是本次讨论的重点。

平方误差损失函数

当L为平方误差损失函数时， L(y,f(x))=(y-f(x))^2 ,

带入提升树，为 $L(y,f_{m-1}+T(x_i;\Theta_m))=[y-f_{m-1}(x)-T(x;\Theta_m)]$

$= [r - T(x;\Theta_m)]$

其中， $r = [y - f_{m-1(x)}]$ 。

可以看出来，损失函数的最小化可以看作让 r 尽量等价于 $T(x;\Theta_m)$ 残差。

r是什么呢， $r = [y - f_{m-1(x)}]$ ，使用平方误差损失函数时的残差值。

其他损失函数

平方误差损失函数的残差 $r = [y - f_{m-1(x)}]$ ，其他损失函数却不一定是，那么有一个通用的残差吗？

大佬Freidman提出了梯度提升树（gradient boosting），这里就是使用损失函数的负梯度作为残差的近似值。

为什么损失函数的负梯度作为残差的近似值？

回到损失函数 $L(y,f_{m-1}+T(x_i;\Theta_m))$ 。

我们将f(x)而不是θ作为自变量。根据梯度下降法，可以得到损失函数参数的更新公式：

$f_m = f_{m-1} - \frac{\partial L}{\partial f}$ ,

同时，因为提升树的定义： $f_m = f_{m-1}+T(x_i;\Theta _m)$ .

于是，就可以得到残差等于负梯度。

JAVA技术分享官

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
4
评论
机器学习笔记之十三——对GBDT的疑问：GBDT的负梯度为什么近似于提升树的残差

先验知识：提升树的优化目标： ,其中yi为真实label，为第m-1个模型，为残差。 ——公式来自李航《统计学习方法》P148...
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。