GBDT推导-拟合负梯度和残差

最新推荐文章于 2024-02-28 11:32:09 发布

Diamond-Mine

最新推荐文章于 2024-02-28 11:32:09 发布

阅读量2.2k

点赞数 3

分类专栏：机器学习

本文链接：https://blog.csdn.net/lgh1700/article/details/100074370

版权

机器学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

梯度提升树-为什么拟合负梯度

将学习器F看做一个参数，损失函数为
$L (y, F)$ ，为使L损失最小，采用梯度下降法：
$F_m=F_{m-1}-\frac{dL}{dF}$
提升树采用加法模型（基函数的线性组合）与前向分布算法：
$F_m=F_{m-1}+T$
T为训练的新树，所以有：
$T=-\frac{dL}{dF}$
因此每次需要拟合的是损失函数的负梯度值。
平方损失是特例（拟合残差）。

平方损失函数-为什么拟合残差

第t轮损失函数的负梯度为
$-\frac{dL(y,F_{t-1})}{dF_{t-1}}$
平方损失函数为
$L(y,F)=\frac{1}{2}(y-F)^2$
负梯度为
$-\frac{dL(y,F_{t-1})}{dF_{t-1}}=$
$-\frac{d(\frac{1}{2}(y-F_{t-1})^2)}{dF_{t-1}}=$
$-\frac{(y-F_{t-1})* d(y-F_{t-1})}{dF_{t-1}}=$
$-\frac{(y-F_{t-1})* -d(F_{t-1})}{dF_{t-1}}=$
$y-F_{t-1})$
当损失函数为平方损失时，负梯度值等于残差值。

初始化弱学习器

$f_0(x)=arg min_c\sum_{i=1}^NL(y_i,c)$
当 $f_0(x)$ 为最小值时，求c的取值。使用平方损失函数，由于平方损失是凸函数，直接求导数为0时c的取值
$\sum_{i=1}^N\frac{\partial L(y_i,c)}{\partial c}=$
$\sum_{i=1}^N\frac{\partial(\frac{1}{2}(y_i-c)^2)}{\partial c}=$
$\sum_{i=1}^N\frac{(y_i-c)*{\partial(y_i-c)}}{\partial c}=$
$\sum_{i=1}^N(c-y_i)$
令导数等于0
$\sum_{i=1}^N(c-y_i)=0$
$\sum_{i=1}^Nc=\sum_{i=1}^Ny_i$
$c=({\sum_{i=1}^Ny_i})/{N}$
初始学习器 $f_0(x)$ = c = 所有训练样本标签值的均值。

Diamond-Mine

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
GBDT推导-拟合负梯度和残差

梯度提升树-为什么拟合负梯度将学习器F看做一个参数，损失函数为L(y,F)L(y,F)L(y,F)，为使L损失最小，采用梯度下降法：Fm=Fm−1−dLdFF_m=F_{m-1}-\frac{dL}{dF}Fm=Fm−1−dFdL提升树采用加法模型（基函数的线性组合）与前向分布算法：Fm=Fm−1+TF_m=F_{m-1}+TFm=Fm−1+TT为训练的新树，所以有：...
复制链接

扫一扫