在面试中把GBDT讲清楚

最新推荐文章于 2024-08-23 12:41:04 发布

Daverain

最新推荐文章于 2024-08-23 12:41:04 发布

阅读量2.9k

点赞数 6

分类专栏：面经机器学习文章标签：机器学习算法 gbdt 人工智能面试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/daverain/article/details/96702696

版权

本文详细介绍了GBDT的原理，包括梯度提升的概念、为何使用Loss的负梯度来拟合下一棵树、CART回归树的回归过程、损失函数的选择以及在分类与回归中的应用差异。此外，还探讨了Shrinkage在防止过拟合中的作用和GBDT的最终输出计算。

摘要由CSDN通过智能技术生成

前言

在面试中，经常会遇到面试官说，你这个项目用到了GBDT，那你能不能介绍一下GBDT的原理？
对于很多同学，其实对GBDT很熟悉，但是很难系统性的把它讲清楚，讲完之后自己都觉得很凌乱，面试官也觉得不够满意。
本文主要参考了好友Freeman_zxp的博客文章和Wepon的文章，并结合了一些自己的思考和理解，欢迎各路大佬来指点和讨论。

正文

首先对GBDT有一个宽泛而全面的介绍

GBDT全称是梯度提升决策树，是监督学习中，一种常见的集成树模型，可以用于处理分类和回归问题。
其中，梯度提升(Grandient Boosting)是Boosting家族中的一种优化算法，决策树使用的是CART回归树作为GBDT的基学习器。

什么是梯度提升？

首先，梯度提升是一种基于函数梯度信息的Boosting方法，与梯度下降有异曲同工之妙。
在每一轮迭代时，我们生成一个基学习器，基学习器的拟合目标是当前模型Loss的负梯度。
当训练完成后，我们将该基学习器加入至模型。
重复上述，继续训练基学习器，直至迭代次数达到目标。
梯度提升的优化原理伪代码如下(图中Loss的负梯度使用了残差，即MSE的负梯度)：

最低0.47元/天解锁文章

关注

6
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Daverain CSDN认证博客专家 CSDN认证企业博客

码龄7年

21: 原创

10万+: 周排名

81万+: 总排名

7万+: 访问

: 等级

943: 积分

29: 粉丝

32: 获赞

16: 评论

147: 收藏

私信

关注

热门文章

分类专栏

面经 5篇
机器学习 10篇
Coding 4篇
spark 5篇
杂七杂八 4篇

最新评论

SimHash算法原理
真·skysys: 应该是有一个词典，给所有词编号，不重复即可
SimHash算法原理
paul_xin: 第一步，并赋予每个特征词一个权重，是怎么赋予权重的呢？随机分配的吗？还是会去学这个参数？
SimHash算法原理
蒙山岚: 感谢分享
HDFS坏块清除和修复
aries_zbc: 为什么我修复了，终端显示成功了，但是用hdfs fsck /; 查询的时候，还是报那个问题
使用spark训练LR模型
yixingqingkong: 请问组装后的那个assembler需要加到stageArray中吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。