学习率衰减 Learning Rate Decay

最新推荐文章于 2022-06-09 00:00:01 发布

Freeman_zxp

最新推荐文章于 2022-06-09 00:00:01 发布

阅读量2.0k

点赞数 1

分类专栏：机器学习文章标签：机器学习学习率算法 learning rate 衰减

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zpalyq110/article/details/81585990

版权

学习率衰减是提升梯度下降算法性能的关键。本文探讨了为何需要学习率衰减，并介绍了指数衰减、自然指数衰减、逆时间衰减和多项式衰减等常见衰减策略，帮助优化学习率，避免错过全局最优解或陷入局部最优。

摘要由CSDN通过智能技术生成

Why should learning rate decay?

以目前最主流的参数优化算法Gradient Descent为例，为了让梯度下降的性能更优，我们需要将学习率设定在一个合适的范围。具体来说，学习率其实就是算法的步长，一步走多少决定了很多事情：步子大了，优化效率高，很可能一下越过最优解；相反，步子小了，优化效率低，很可能陷进一个局部最优解怎么都走不出来。所以学习率的调整在算法参数最优的过程中至关重要。

How decay learning rate?

exponential_decay:指数衰减
decayed_learning_rate = learning_rate * decay_rate ^ (global_step / decay_steps)
natural_exp_decay:自然指数衰减
decayed_learning_rate = learning_rate * exp(-decay_rate * global_step)
inverse_time_decay:逆时间衰减
decayed_learning_rate = learning_rate / (1 + decay_rate * global_step / decay_step)
polynomial_decay:多项式衰减
global_step = min(global_step, decay_steps)
decayed_learning_rate = (learning_rate -

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。