机器学习模型（一） GBDT

最新推荐文章于 2024-08-06 19:10:59 发布

ZixuanKe

最新推荐文章于 2024-08-06 19:10:59 发布

阅读量6.2k

点赞数 3

分类专栏：机器学习模型文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ZixuanKe/article/details/51284306

版权

本文深入探讨了GBDT（Gradient Boosting Decision Tree）的原理，包括模型构建、损失函数和优化策略。它能处理分类回归问题，具有高准确性和解释性，但也需要数据预处理。GBDT在预测Yelp评论的"Useful"票数的应用中，通过特征重要性和局部依赖图展示了其解释能力。

摘要由CSDN通过智能技术生成

一、概述

GBDT（GradientBoosting Decision Tree）/ GBRT（Gradient Boosting Regression Trees），是一个比较广泛的概念，可以使用不同的损失函数解决分类回归问题，但值得注意的是这里用的决策树总是“回归树”。同时，也是一个准确的，有效的，现成的可以用于回归或者分类问题的模型。包括网页搜索和生态学都有应用。

二、原理

i. 模型（假设函数）

其中：

是弱学习其的假设函数

即：

对每个弱分类器结果进行累加

ii. 算法

逐步迭代，其中是能够使得当前模型损失函数最小的

即:

GradientBoosting求解这个最小化问题的方法是：总是往损失函数的负梯度方向移动，即

注：计算损失函数的负梯度在当前模型的值，将它作为残差的估计，对于平方损失函数它就是残差，对于一般损失函数，它就是残差（预测值与真实值的差）的近似值，对于分类问题，实际处理可以加入logistic变化。

对于步长，使用线搜索（Line Search）的方法，即：

最低0.47元/天解锁文章

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。