gbdt降低学习率可以实现正则化效果呢

最新推荐文章于 2023-05-23 20:25:53 发布

Takoony

最新推荐文章于 2023-05-23 20:25:53 发布

阅读量1.8k

点赞数 5

分类专栏： deep learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ningyanggege/article/details/87974691

版权

deep learning 专栏收录该内容

166 篇文章 17 订阅

订阅专栏

问题：为什么降低学习率可以会有正则化效果呢？

因为一般根据在神经网络的经验而言，降低学习率，可以实现更高的训练效果，即进一步拟合；

在gbdt中，这个学习率与神经网络中的学习率担任的角色不一样；

gbdt中的学习率主要是调节每棵树的对预测结果的贡献；如果学习率下降，就降低了每棵树的贡献；模型训练的预测效果就会下降；为了达到和高学习率相同的效果，就需要生成更多的树；

当时的疑惑是如果下降学习率，那么就会生成更多的树，就会更加拟合；怎么会有正则化效果呢？

因为下降学习率，并没有增加更多的树，前提假设其他的超参是不变的；

在学习率等超参数固定的情况下，树的数量越多，就模型训练精度越高；

在树的数量等超参数固定的情况下，学习率越高，模型训练精度越高；

关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
gbdt降低学习率可以实现正则化效果呢

问题：为什么降低学习率可以会有正则化效果呢？因为一般根据在神经网络的经验而言，降低学习率，可以实现更高的训练效果，即进一步拟合；在gbdt中，这个学习率与神经网络中的学习率担任的角色不一样；gbdt中的学习率主要是调节每棵树的对预测结果的贡献；如果学习率下降，就降低了每棵树的贡献；模型训练的预测效果就会下降；为了达到和高学习率相同的效果，就需要生成更多的树；当时的疑惑是如果下降学习...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。