机器学习系列5：GBDT

最新推荐文章于 2024-03-20 09:16:57 发布

咋找不到昵称

最新推荐文章于 2024-03-20 09:16:57 发布

阅读量315

点赞数

分类专栏：机器学习文章标签： GBDT

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/x_lingbai/article/details/80398367

版权

文章目录

1、GBDT的算法原理

原始论文地址：Greedy Function Approximation:A Gradient Bossting MAchine

原文很长，我这里只是简单介绍了GBDT的原理部分。最开始解除这个是在李航《统计学习方法》中，但李航书中介绍比较简单，这里参考一个博客，GBDT小结，讲的比较好(下面部分内容来自该博客，感谢博主，引用请指名原出处)。

提升树利用加法模型和前向分步算法实现学习的优化过程。当损失函数时平方损失和指数损失函数时，每一步的优化很简单，如平方损失函数学习残差回归树。

无论是分类还是回归：GBDT中用到的树都是回归树CART，不是分类树，GBDT也使用迭代决策算法，每一轮迭代生成的树都是拟合上一轮的残差，但和一般提升树不同的是，GBDT会用损失函数的负梯度（残差的减少方向）来拟合残差，叫伪残差。

假设我们的优化目标是：
$F^*(x) = arg\min_{F(x)}E_{y,x}[L(y,F(x))]$

预测函数 $F (x)$ 的参数为：$ P={ P_1,P_2…P_M } , P_m= \beta_m,\alpha_m $，第 m 个弱分类器或者回归树表示为：$ \beta_m h(x;\alpha_m)$, $\beta_m$ 为弱分类器的系数(权重)， $\alpha_m$ 表示其参数，则有：

那么对于样本 $[ {x_i,y_i } ]^N$ ,优化问题变为：
$(\beta_m,\alpha_m)= arg\min_{\alpha,\beta}(\sum_{i=1}^N) L(y_i,F_{m-1}(x_i)+\beta h(x_i,\alpha))$

最低0.47元/天解锁文章

咋找不到昵称

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习系列5：GBDT

该系列将整理机器学习相关知识。这篇博客主要讨论: 1 GBDT GBDT、Xgboost、LightGBM在机器学习中应用是否广泛，也是各种机器学习竞赛(kaggle)的常用方法。比如我在做kaggle的一些练习时，通常会用随机森林、GBDT作为基线方法，然后会再使用Xgboost、LightGBM做进一步优化，最后将上面几个方法的结果做个最总的融合（stacking）。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。