树模型详解2-GBDT算法

爱学习的uu

于 2024-07-06 16:35:57 发布

阅读量412

点赞数 10

文章标签：人工智能机器学习算法数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_60792028/article/details/140213437

版权

与adaboost一样，GBDT也是采用前向分步算法，只是它会用决策树cart算法作为基学习器，因此先要从分类树和回归树讲起

决策树-提升树-梯度提升树

决策树cart算法

回归树：叶子结点的值是所有样本落在该叶子结点的平均值

如何构建：1.深度？2.划分结点如何选取3.叶子结点cm值

1的方法：深度/子结点包含样本数/精度

3的方法:取均值损失最小

2的方法：找到一个划分条件使得cm求和最小

采用的损失：平方损失

分类树：结点不止有特征，还有特征的属性

特征选择方式：选择gini值最小的特征作为划分标准

GBDT：梯度提升树，基分类器是决策树，且权重均为1

二分类问题的提升树：

是adaboost的特殊情况：基分类器为二类分类树，且权重为1，损失函数用指数损失函数

回归问题的提升树：让当前树拟合残差

GBDT:作用：考虑一般问题，解决不管损失函数是什么都能求解

方法：泰勒展开推导：由此得到步骤为：

1.计算当前损失函数的负梯度

2.将xi，yi带入损失函数，得到第m轮的训练数据集Tm={（x1，rm1），（x2，rm2）...}

3.让当前的基学习器拟合上述样本

如何用它解释回归问题的提升树？

L=1/2(Y-F(X))2，对fx求导得y-f（x）=rm残差

那么GBDT如何解决二分类问题？回归树能不能做二分类？

问题：无法直接输出类别或者概率预估

解决方案：通过sigmoid函数将加法模型映射到0-1的空间中，再用交叉熵损失进行学习

损失函数：

负梯度为Y-1/（1+e-fm(x)）=Y-Ym-1

所以rmi=yi-ym-1，i来构造训练样本

损失函数决定了cm的取值，所以损失函数最好是能最大程度地拟合残差，最终我们得到的最优损失函数（用总体损失）和它对应的cm为

但这个cmj无法解出，通过二阶泰勒展开得到其解

但是，使用总体损失对回归树进行优化，计算过于复杂，而使用MSE划分得到的树的结构是一样的，因此实际步骤为：

1、用传统回归数构建好回归树的结构

2、用总体损失中的方式计算树的叶子节点中的cmj

为了避免过拟合，有时也加上一个学习率，让它不要学的太满

最后讲GBDT+LR:

那么如何用决策树构造新特征呢？

构建完所有叶子节点后，再送到逻辑回归中，进行CTR预估，注意这两步是独立的，因此不用将LR的梯度传回到GBDT

优点：自动做特征工程缺点：容易过拟合

关注

10
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
树模型详解2-GBDT算法

损失函数决定了cm的取值，所以损失函数最好是能最大程度地拟合残差，最终我们得到的最优损失函数（用总体损失）和它对应的cm为。构建完所有叶子节点后，再送到逻辑回归中，进行CTR预估，注意这两步是独立的，因此不用将LR的梯度传回到GBDT。2.将xi，yi带入损失函数，得到第m轮的训练数据集Tm={（x1，rm1），（x2，rm2）...}是adaboost的特殊情况：基分类器为二类分类树，且权重为1，损失函数用指数损失函数。如何构建：1.深度？GBDT：梯度提升树，基分类器是决策树，且权重均为1。
复制链接

扫一扫

爱学习的uu CSDN认证博客专家 CSDN认证企业博客

码龄3年

43: 原创

4万+: 周排名

2万+: 总排名

2万+: 访问

: 等级

1169: 积分

470: 粉丝

706: 获赞

3: 评论

292: 收藏

私信

关注

热门文章

最新评论

kaggle竞赛实战1
普通网友: 感谢大佬分享好文，学到了不少新知识，支持大佬，期待大佬持续输出优质文章！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
你绝对没看过的求职及职场经验分享1—面试篇
普通网友: 好文！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
模型套路1——神经网络模型训练
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/618289361。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。