进一步讨论GradientBoosting分类

littlehuangnan

已于 2022-10-15 16:37:01 修改

阅读量409

点赞数

文章标签：分类决策树机器学习

于 2022-09-14 22:51:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/littlehuangnan/article/details/126861192

版权

GradientBoosting回归（平方损失）比较容易理解：

1.训练一棵树拟合残差

2.输入训练数据到这棵树，输出预测值

3.用预测值更新残差

4.重复1-3

对于分类问题，并不是像决策树分类那样用投票来完成的。GradientBoosting分类中，Boosting的对象也是回归树。在回归问题中，树输出的预测值是所在节点的平均值，残差就是标签值减去输出值，这和平方损失的梯度是一致的。当然，这可能也带来了那个广为流传的谬误：gbdt是一阶导，xgboost是二阶导。

在分类问题中，回顾逻辑回归，预测值是输出值经过sigmoid变换得到的。那输出值是什么呢？不能也是所在节点的平均值吧？

在论文FHT00中，Friedman称这种算法为LogitBoost。R包gbm、scikit-learn的GradientBoostingClassifier实际上都是实现了LogitBoost。

输出值不是所在节点的平均值，而是所在节点经过sigmoid变换后的平均值除以一个权重。

这个y一弯又叫pseudo-respond，是y经过sigmoid变换得到的。有人看到这会说，这不就是一阶导吗。没错，但你把boosting和Itera

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
进一步讨论GradientBoosting分类

gbdt xgboost 梯度提升分类 logitboost
复制链接

扫一扫

littlehuangnan CSDN认证博客专家 CSDN认证企业博客

码龄13年

30: 原创

61万+: 周排名

192万+: 总排名

2万+: 访问

: 等级

306: 积分

2: 粉丝

3: 获赞

4: 评论

19: 收藏

私信

关注

最新评论

clickhouse的MergeTree几个要点
qq_45899704: 后台线程合并数据的最大时间是多久呢
功效分析与样本容量
m0_71041255: 可以留一个联系方式吗我有问题想请教你
用pytorch实现boxcox变换
思考实践: 您好，您这个代码我运行scipy的结果与torch的对不上，是不是torch版本的box-cox不完全
clickhouse的MergeTree几个要点
CSDN-Ada助手: 推荐 MySQL入门技能树：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。