梯度提升树（GBDT）理解

最新推荐文章于 2023-03-21 11:14:00 发布

Star_ACE

最新推荐文章于 2023-03-21 11:14:00 发布

阅读量401

点赞数

分类专栏：树算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34886403/article/details/82704940

版权

树算法专栏收录该内容

2 篇文章 0 订阅

订阅专栏

GBDT是集成学习方法Boosting中的一种，所以其中每个弱分类器都有先后顺序，同时每个弱分类器都有其的权重。

GBDT的思想
在GBDT的迭代过程中，假如前一轮迭代得到的强分类器是 $F_{m-1}(x)$ ,而其的损失函数为 $L(y,F_{m-1}(x))$ ,这是本轮的的迭代就是找一个CART回归树模型（弱分类器） $T(x;\theta_m)$ ，让本轮的损失 $L（y,F_{m-1}+\rho_m T(x;\theta_m)）$ 最小。简单说，就是本轮要找个决策树，使得已有的强分类器的损失变小。

“GBDT的核心”
Freidman提出用损失函数的负梯度来表示本轮损失的近似值，进而确定CART树。

假如迭代到第M轮，这时损失函数的负梯度就可以表示为如下：

g m i = - [\partial L ( y i , F m ( x i ) ) \partial F ( x i )] F (x) = F m - 1 (x)

$g_{mi}=-[\frac{\partial L(y_i,F_m(x_i))}{\partial F{(x_i)}}]_{F(x)=F_{m-1} \ (x)}$
其中i=1，2···N表示样本数。

这个负梯度就是本轮迭代的损失值，也就是我们优化CART树的标签。即有：

θ m = a r g m i n α, β \sum i = 1 N [g m i - β T m (x i; θ)] 2

$\theta_m=argmin_{\alpha,\beta}\sum_{i=1}^{N}[g_{mi}-\beta T_m(x_i;\theta)]^2$
这里用

Tm(x;θ) T m ( x ; θ ) $T_m(x;\theta)$ 去拟合上面提到的“标签”，而且使用了最小二乘法的拟合方法。

同时每个弱分类器都有其的权重，这里我们可以理解成“步长”：

ρ m = a r g m i n ρ \sum i = 1 N L (y i, F m - 1 (x i) + ρ T (x i, θ m))

$\rho_m=argmin_{\rho} \sum_{i=1}^NL(y_i,F_{m-1}(x_i)+\rho T(x_i,\theta_m))$

最后迭代完这轮后，得到的强分类器 $F_m(x)=F_{m-1}(x)+\rho_m T(x;\theta_m)$

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Star_ACE CSDN认证博客专家 CSDN认证企业博客

码龄8年

50: 原创

52万+: 周排名

69万+: 总排名

71万+: 访问

: 等级

3710: 积分

244: 粉丝

568: 获赞

59: 评论

2715: 收藏

私信

关注

热门文章

分类专栏

最新评论

OCR技术（文字定位与切割）
Diana_F: 博主，所以现在还是没有一个分割汉字效果不错的方法吗（哭泣）
残差结构详解
q-类星体: 感谢楼主分享，受益匪浅，这几天在炼丹侠租到了A100，使用很顺畅，关键有新人注册优惠券，希望能帮助楼主完成训练
残差结构详解
Shengheshan: 是博主写错了，应该把一个256改为64
机器学习中数据不均衡问题（分类类别数据不均匀）
陈嘿萌: 做好数据预处理、数据扩充、GAN生成样本、或者旋转、翻转等扩充样本数。
机器学习中数据不均衡问题（分类类别数据不均匀）
执金吾丶: 你好，想问一下你的问题解决了吗？如果解决的话，可以把解决办法传授一下么。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。