GBDT，LightGBM

最新推荐文章于 2024-05-23 17:48:45 发布

1只小包子

最新推荐文章于 2024-05-23 17:48:45 发布

阅读量839

点赞数 1

分类专栏：机器学习基石文章标签： GBDT

本文链接：https://blog.csdn.net/a940902940902/article/details/84763491

版权

机器学习基石专栏收录该内容

19 篇文章 1 订阅

订阅专栏

GBDT

添加链接描述
GB:Gradient Boost 学习策略
DT:Decision Tree 决策树模型
GBDT：使用Gradient Boost 训练决策树模型
结果：一组回归分类树的组合（CART Ensemble ） T₁,T₂,T₃ …
其中T_i 学习的是T _i-1 的残差
此时需要解决两个问题：
1.残差是如何计算的
2.一组回归分类树是如何ensemble的

Gradient Boosting

Gradient Boosting
Gradient Boosting=Gradient Descent + boosting
给定训练样本 (x₁,y₁),(x₂,y₂),…,(x_n,y_n)
训练模型 F(x) 使得损失函数 loss=∑_n1/2（y_i-F(x_i))²最小
假设已经存在一个基模型 F^’(x₁)=0.8 y₁=0.9 ,F^’(x₂)=1.4 y₂=1.3 …
在不能修改F^’的前提下如何提高模型的表现呢
一个简单的想法就是增加一个model h
使得：
在这里插入图片描述

即：
在这里插入图片描述

以regression tree 为例对于原始数据x₁,y₁),(x₂,y₂),…,(x_n,y_n) 我们需要训练一个regression tree 使得x₁,F(₁)),(x₂,F(x₂)),…,(x_n,F(x_n)) 和₁,y₁),(x₂,y₂),…,(x_n,y_n) 尽量接近
同样的对于h(x) 需要训练（x₁,h(x₁)）,(x₂,h(x₂))…
和（x₁,y₁-F(x₁)）,(x₂,y₂-F(x₂))…尽量接近
其中 y₁-F(x₁)称为残差 h（x）的作用就是补偿当前函数的残差
如果在F(x)+h(x) 依旧有残差存在那么可以继续增加另外一个regression tree 来补齐这个残差
接下来我们看一看这个所谓的残差和梯度有什么关系
对于损失函数 loss=∑_i1/2（y_i-F(x_i))²
要最小化这个损失函数
在这里插入图片描述