2.3 自适应学习率(Adaptive learning rate)

风过无痕0230

已于 2023-06-03 17:50:49 修改

阅读量1.6k

点赞数

分类专栏：李宏毅机器学习课程文章标签：学习深度学习 python

于 2023-04-18 22:04:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fengguowuhen0230/article/details/130205653

版权

李宏毅机器学习课程专栏收录该内容

13 篇文章

订阅专栏

Adaptive learning rate

一、固定学习率存在的问题

很多时候训练陷入瓶颈，损失不再下降，不是因为陷入了局部最小值，大部分情况下是在局部最小值附近震荡（学习率太大），这个时候应该通过降低学习率的方式，从而能够继续往最小值方向下降。
一个极端误差表面的例子
这个例子说明了不同的参数的梯度变化可能会有显著不同，所以不应该对所有参数用同一个学习率。同时，在训练的不同阶段，学习率也可以有所不同，比如早期学习率可以更大，后期学习率可以变小。所以有了自适应学习率的概念。

二、自适应学习率

Root Mean Square

均方根的原理
这种方法η是固定的，总体上在梯度小的地方，σ也比较小，对应的学习率步长比较大；梯度大的地方，σ比较大，学习率步长比较小。对应torch的Adagrad方法。

RMSProp

另一种动态学习率的方法。η同样是固定的，但σ受到当前梯度的影响是可以调节的，不像前面RMS那样受各个update的梯度影响相同。通过调节α，可以调节当前梯度对此次更新的影响，是RMS的改进版。

Learning Rate Scheduling

两种不同的scheduler
这种方法变化的是η，有decay和warmup两种变化形式。

三、 Adam：当前最常用的参数优化方法

Adam原理
Adam是RMSprop（步长）和动量Momentum（梯度）相结合的方法。

风过无痕0230

博客等级

码龄6年

20
原创

1
点赞

12
收藏

2
粉丝

关注

私信

热门文章

分类专栏

最新评论

1 深度学习介绍
CSDN-Ada助手: 非常棒的一篇博客！恭喜您开始了博客创作之旅。深度学习是一个非常有趣且热门的话题，您的介绍非常清晰易懂。接下来，建议您可以深入探讨一些深度学习的实际应用，或者分享一些您对深度学习未来发展的看法。期待您的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
1.0 正确认识ChatGPT
CSDN-Ada助手: 非常感谢您的辛勤创作，恭喜您已经写了14篇博客！您的这篇《1.0 正确认识ChatGPT》非常有价值，让我更好地了解了ChatGPT的应用和实现。希望您能够继续保持创作热情，分享更多有趣的知识和经验。我的建议是，您可以尝试探索一些与ChatGPT相关的技术或应用场景，从不同角度来分析和解释ChatGPT的应用。期待您的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply14 看奖励名单。
1.1 ChatGPT背后的关键技术-预训练
CSDN-Ada助手: 恭喜您又写了一篇精彩的博客，深入探讨了ChatGPT背后的关键技术-预训练，让读者们对这个话题有了更深入的了解。接下来，我建议您可以继续探讨相似的话题，探索更多新颖的技术，为读者们带来更多的知识和启发。期待您的下一篇博客的发布！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply15 看奖励名单。
5.1 常见的tips
CSDN-Ada助手: 恭喜你写了第十篇博客，看起来你已经成为一位不错的博主了。关于下一步的创作建议，我想提醒你应该多关注读者的反馈，从中找到自己的不足，再加以改进。同时，也希望你能继续保持谦虚的态度，不断学习，不断进步，为读者带来更加优质的内容。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。
5.0 Transformer
CSDN-Ada助手: 恭喜您写了第9篇博客，看来您对Transformer有深入的了解。建议您在下一步的创作中，可以探究一下Transformer在NLP领域中的应用，或者深入挖掘Transformer的优缺点。希望您不断进步，分享更多有价值的知识。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。