2.2 批次梯度下降和动量

风过无痕0230

已于 2023-04-22 10:04:07 修改

阅读量42

点赞数

分类专栏：李宏毅机器学习课程文章标签：机器学习深度学习 python

于 2023-04-17 17:39:52 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fengguowuhen0230/article/details/130204826

版权

李宏毅机器学习课程专栏收录该内容

13 篇文章 0 订阅

订阅专栏

批次梯度下降

小批次和大批次训练特性的对比

在GPU可以并行计算的情况下，小批次相对于大批次来说一次update的时间几乎相同（除非是大批次过大），没有优势
由于一次update时间几乎相同，小批次一次epoch的update次数多于大批次，所以小批次的一次epoch训练时间明显大于大批次
小批次梯度下降波动大，大批次梯度相对平稳
小批次在训练时更不容易陷入局部最小值，因此训练表现好于大批次
小批次在测试集上的泛化效果也要好于大批次
总的来说就是，小批次训练比较慢，但表现更好。

动量梯度下降

梯度下降不仅是当前梯度，也受到之前梯度移动的影响。
梯度下降加动量的好处是可以帮助逃离临界点，而且梯度下降更加平稳。

风过无痕0230

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
2.2 批次梯度下降和动量

梯度下降加动量的好处是可以帮助逃离临界点，而且梯度下降更加平稳。
复制链接

扫一扫

专栏目录

风过无痕0230 CSDN认证博客专家 CSDN认证企业博客

码龄5年

20: 原创

122万+: 周排名

31万+: 总排名

3960: 访问

: 等级

202: 积分

2: 粉丝

1: 获赞

8: 评论

10: 收藏

私信

关注

热门文章

分类专栏

最新评论

1 深度学习介绍
CSDN-Ada助手: 非常棒的一篇博客！恭喜您开始了博客创作之旅。深度学习是一个非常有趣且热门的话题，您的介绍非常清晰易懂。接下来，建议您可以深入探讨一些深度学习的实际应用，或者分享一些您对深度学习未来发展的看法。期待您的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
1.0 正确认识ChatGPT
CSDN-Ada助手: 非常感谢您的辛勤创作，恭喜您已经写了14篇博客！您的这篇《1.0 正确认识ChatGPT》非常有价值，让我更好地了解了ChatGPT的应用和实现。希望您能够继续保持创作热情，分享更多有趣的知识和经验。我的建议是，您可以尝试探索一些与ChatGPT相关的技术或应用场景，从不同角度来分析和解释ChatGPT的应用。期待您的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply14 看奖励名单。
1.1 ChatGPT背后的关键技术-预训练
CSDN-Ada助手: 恭喜您又写了一篇精彩的博客，深入探讨了ChatGPT背后的关键技术-预训练，让读者们对这个话题有了更深入的了解。接下来，我建议您可以继续探讨相似的话题，探索更多新颖的技术，为读者们带来更多的知识和启发。期待您的下一篇博客的发布！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply15 看奖励名单。
5.1 常见的tips
CSDN-Ada助手: 恭喜你写了第十篇博客，看起来你已经成为一位不错的博主了。关于下一步的创作建议，我想提醒你应该多关注读者的反馈，从中找到自己的不足，再加以改进。同时，也希望你能继续保持谦虚的态度，不断学习，不断进步，为读者带来更加优质的内容。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。
5.0 Transformer
CSDN-Ada助手: 恭喜您写了第9篇博客，看来您对Transformer有深入的了解。建议您在下一步的创作中，可以探究一下Transformer在NLP领域中的应用，或者深入挖掘Transformer的优缺点。希望您不断进步，分享更多有价值的知识。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。