xgboost梯度计算的过程

最新推荐文章于 2021-12-06 11:22:08 发布

波波虾遁地兽

最新推荐文章于 2021-12-06 11:22:08 发布

阅读量1.4k

点赞数 3

分类专栏：复习知识-机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/zlb872551601/article/details/103609622

版权

复习知识-机器学习专栏收录该内容

17 篇文章 2 订阅

订阅专栏

xgboost梯度计算的过程

之前对xgboost梯度计算过程有误区，这里纠正一下，并mark,提醒自己一下

泰勒公式的二阶展开形式如下：
$f(x+\Delta{x}) \approx f(x)+f^{\prime}(x)\Delta{x}+f^{\prime\prime}(x)\Delta{x}^{2}$
回到我们的问题上来，f(x)对应我们的损失函数l(),x对应我们的t-1棵树的预测值， $\Delta{x}$ 对应我们正在训练的第t棵树。

首先我们定义损失函数l()关于 $\hat{y}^{(t-1)}$ 的一阶偏导数和二阶偏导数：
$g_i=\partial_{\hat{y}^{(t-1)}}l(y_i,\hat{y}^{(t-1)}),h_i=\partial^{2}_{\hat{y}^{(t-1)}}l(y_i,\hat{y}^{(t-1)})$
这里插一句，如果就是平方损失（比较常用）， $l(y_i,\hat{y_i})=(y_i-\hat{y_i})^{2}$
那么，
$g_i=\partial_{\hat{y}^{(t-1)}}l(y_i,\hat{y}^{(t-1)})=2(y_i-\hat{y_i}^{(t-1)}),\\ h_i=\partial^{2}_{\hat{y}^{(t-1)}}l(y_i,\hat{y}^{(t-1)})=-2$
这样对吗？

（注意xgb梯度计算中用到的是上一次的预测值，
这里就有一个问题，那么对于第一次计算梯度时，根本没有上一次的预测值怎么办？所以才有了一个全局偏置的超参，base_score：初始化预测分数，全局偏置。用于提供第一次梯度的计算。
xgb梯度计算中用到的不是本轮的预测值,而是利用上一轮的预测值来计算一阶导和二阶导的，所以对于分裂点计算前，各样本的一阶导和二阶导都是计算好的）

波波虾遁地兽

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
xgboost梯度计算的过程

xgboost梯度计算的过程之前对xgboost梯度计算过程有误区，这里纠正一下，并mark,提醒自己一下泰勒公式的二阶展开形式如下：f(x+Δx)≈f(x)+f′(x)Δx+f′′(x)Δx2f(x+\Delta{x}) \approx f(x)+f^{\prime}(x)\Delta{x}+f^{\prime\prime}(x)\Delta{x}^{2}f(x+Δx)≈f(x)+f′(x...
复制链接

扫一扫