3-4 机器学习进阶-GBDT原理、常用损失函数、如何用于分类、优缺点

沉睡的小卡比兽

已于 2022-01-29 11:25:47 修改

阅读量1.6k

点赞数 1

分类专栏： AI基础知识文章标签：分类机器学习算法

于 2022-01-22 18:31:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chen10314/article/details/122595481

版权

AI基础知识专栏收录该内容

26 篇文章 3 订阅

订阅专栏

1、简述GBDT原理

2、GBDT常用损失函数有哪些

3、GBDT如何用于分类

4、为什么GBDT不适合使用高维稀疏特征？

5、GBDT算法的优缺点

1、简述GBDT原理

1、根据训练集训练一棵初始的决策树

2、计算之前所有树在此数据集上预测结果之和与真实结果的差值，也叫做残差

3、把残差作为当前树拟合目标在训练集上训练

4、将训练得到的决策树集成到GBDT集成模型上

5、重复2-4，直到达到设置的阈值（树的个数、早停策略等）

2、GBDT常用损失函数有哪些

回归问题常用损失（MAE、MSE、RMSE）：

还有组合损失如Huber Loss（MAE和MSE结合）

组合损失的好处（1）在0附近可导（2）loss较大时为MAE，较小时为MSE，降低梯度能够逐步靠近最优点

分类问题损失：

交叉熵、指数损失函数exp(-y*f(x)) y为label{-1，1}；f(x)为预测值

3、GBDT如何用于分类

做分类任务和回归任务相似，所用的损失函数不同

4、为什么GBDT不适合使用高维稀疏特征？

高维稀疏特征使得树模型训练变得低效，容易造成过拟合

高维稀疏特征导致子树数量多，每次分裂只能筛选少量样本，导致泛化性弱

5、GBDT算法的优缺点

优点：预测计算可并行，速度快

稠密数据，泛化能力和表现较好

决策树做弱分类器：可解释性和鲁棒性好，可以发现特征间的高阶关系，不需要对数据做过多预处理。

缺点：高维稀疏特征效果不好，训练阶段为串行结构速度较慢

沉睡的小卡比兽

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
3-4 机器学习进阶-GBDT原理、常用损失函数、如何用于分类、优缺点

GBDT原理、常用损失函数、如何用于分类、优缺点1、简述GBDT原理2、GBDT常用损失函数有哪些3、GBDT如何用于分类4、为什么GBDT不适合使用高维稀疏特征？5、GBDT算法的优缺点
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。