GBDT是否需要进行归一化操作？

最新推荐文章于 2023-08-31 16:09:29 发布

真心乖宝宝

最新推荐文章于 2023-08-31 16:09:29 发布

阅读量4.4k

点赞数 4

分类专栏：机器学习知识点

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45069761/article/details/108415384

版权

机器学习知识点专栏收录该内容

17 篇文章 0 订阅

订阅专栏

概率模型不需要归一化，因为它们不关心变量的值，而是关心变量的分布和变量之间的条件概率，如决策树、rf。
而像adaboost、svm、lr、KNN、KMeans之类的最优化问题就需要归一化

为什么GBDT需要进行归一化操作

因为GBDT的树是在上一颗树的基础上通过梯度下降求解最优解，归一化能收敛的更快，GBDT通过减少偏差来提高性能，而随机森林本来就是通过减少方差提高性能的，树之间建立关系是独立的，不需要归一化

对于线性模型，特征值差别很大时，比如说LR，我有两个特征，一个是(0,1)的，一个是(0,10000)的，运用梯度下降的时候，损失等高线是椭圆形，需要进行多次迭代才能到达最优点。但是如果进行了归一化，那么等高线就是圆形的，促使SGD往原点迭代，从而导致需要的迭代次数较少

为什么树模型不需要归一化

因为数值缩放不影响分裂点位置，对树模型的结构不造成影响，而且是不能进行梯度下降的，因为构建树模型（回归树）寻找最优点时是通过寻找最优分裂点完成的，因此树模型是阶跃的，阶跃点是不可导的，并且求导没意义，也就不需要归一化

参考文章
参考文章1

真心乖宝宝

关注

4
点赞
踩
17

收藏

觉得还不错? 一键收藏
1
评论
GBDT是否需要进行归一化操作？

概率模型不需要归一化，因为它们不关心变量的值，而是关心变量的分布和变量之间的条件概率，如决策树、rf。而像adaboost、svm、lr、KNN、KMeans之类的最优化问题就需要归一化为什么GBDT需要进行归一化操作因为GBDT的树是在上一颗树的基础上通过梯度下降求解最优解，归一化能收敛的更快，GBDT通过减少偏差来提高性能，而随机森林本来就是通过减少方差提高性能的，树之间建立关系是独立的，不需要归一化对于线性模型，特征值差别很大时，比如说LR，我有两个特征，一个是(0,1)的，一个是(.
复制链接

扫一扫

专栏目录

真心乖宝宝 CSDN认证博客专家 CSDN认证企业博客

码龄5年

84: 原创

24万+: 周排名

124万+: 总排名

13万+: 访问

: 等级

1697: 积分

29: 粉丝

176: 获赞

53: 评论

459: 收藏

私信

关注

热门文章

分类专栏

最新评论

如何判断有向图有环 --＞拓扑排序
Eli A: 下面放个链接疯狂跳转美团和淘宝什么意思
如何判断有向图有环 --＞拓扑排序
陌上迟迟归: 刚刚还把这道题提交给老师下午讲，看了你的，发现完了，我会了，这挺简单我还问老师不会杀了我吧
GBDT是否需要进行归一化操作？
TingXiao-Ul: 树模型都不需要归一化操作，同样GBDT也不需要。以树模型作基学习器，特征的作用都只是用来分裂节点，scaling不scaling不会影响分裂的结果
GBDT是否需要进行归一化操作？
TingXiao-Ul: 树模型都不需要归一化处理，同样GBDT也不需要，以树模型作基学习器，特征的作用都只是用来分裂节点，scaling不scaling不会影响分裂的结果
git代码回滚
泡面盖饭: 非常不错，感谢楼主的分享

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。