gdbt java_GBDT--原来是这么回事(附代码)

最新推荐文章于 2021-03-01 20:23:21 发布

weixin_39980347

最新推荐文章于 2021-03-01 20:23:21 发布

阅读量90

点赞数

文章标签： gdbt java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39980347/article/details/114170646

版权

GBDT(梯度提升决策树)是一种基于Boosting的机器学习算法，通过逐次迭代弱分类器来减少误差。本文介绍了GBDT的基本原理，包括Boosting思想，GBDT的工作机制，并通过实例说明了其训练过程。同时，文章还探讨了GBDT与随机森林的区别，以及GBDT在实际应用中的优缺点。

摘要由CSDN通过智能技术生成

1. 解释一下GBDT算法的过程

GBDT(Gradient Boosting Decision Tree)，全名叫梯度提升决策树，使用的是Boosting的思想。

1.1 Boosting思想

Boosting方法训练基分类器时采用串行的方式，各个基分类器之间有依赖。它的基本思路是将基分类器层层叠加，每一层在训练的时候，对前一层基分类器分错的样本，给予更高的权重。测试时，根据各层分类器的结果的加权得到最终结果。

Bagging与Boosting的串行训练方式不同，Bagging方法在训练过程中，各基分类器之间无强依赖，可以进行并行训练。

1.2 GBDT原来是这么回事

GBDT的原理很简单，就是所有弱分类器的结果相加等于预测值，然后下一个弱分类器去拟合误差函数对预测值的残差(这个残差就是预测值与真实值之间的误差)。当然了，它里面的弱分类器的表现形式就是各棵树。

举一个非常简单的例子，比如我今年30岁了，但计算机或者模型GBDT并不知道我今年多少岁，那GBDT咋办呢？

它会在第一个弱分类器(或第一棵树中)随便用一个年龄比如20岁来拟合，然后发现误差有10岁；

接下来在第二棵树中，用6岁去拟合剩下的损失，发现差距还有4岁；

接着在第三棵树中用3岁拟合剩下的差距，发现差距只有1岁了；

最后在第四课树中用1岁拟合剩下的残差，完美。

最终，四棵树的结论加起来，就是真实年龄30岁(实际工程中，gbdt是计算负梯度，用负梯度近似残差)。

为何gbdt可以用用负梯度近似残差呢

最低0.47元/天解锁文章

weixin_39980347

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。