浅谈batch, batch_size, lr, num_epochs

最新推荐文章于 2024-06-24 15:01:40 发布

林小乙

最新推荐文章于 2024-06-24 15:01:40 发布

阅读量1.5k

点赞数 4

分类专栏：深度学习ing 文章标签： batch 深度学习机器学习 python pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lin_xiao_yi/article/details/130075640

版权

深度学习ing 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

文章探讨了深度学习中几个关键参数的理解，包括批量(batch)与批量大小(batch_size)在优化过程中的作用，学习率(lr)如何影响参数更新，以及训练周期(num_epochs)对模型训练的影响。作者指出，尽管每个小批量都在降低损失函数，但多遍历训练集能帮助模型更好地泛化，防止过拟合或欠拟合，num_epochs作为超参数需要适当地调整来平衡模型性能。

摘要由CSDN通过智能技术生成

深度学习的入门者对这几个参数的见解，看了很多文章，博客终于有了自己的一点见解

batch：叫做批量，也就是一个训练集，通常是一个小的训练集。然后在上面做梯度下降，优化的算法叫随机梯度下降法。

batch_size:叫做小批量，这个取值通常是2**n，将一个训练集分成多个小批量进行优化。这种优化算法叫做批量随机优化算法，这种算法更加常用，因为下一个小批量会根据上一个小批量计算出来的参数继续进行优化，更新。

lr：是learning rate（学习率）也就是步长，每次更新参数所走的一个步长。这个步长值通常比较小，但是不能很小，如果大的话可能会引起更新参数的震荡，小的话就会更新得很慢，可能一直达不到收敛。

num_epochs:这个是一个周期。一个训练周期是指完全遍历完整个训练集，而和batch_size不同，batch_size是将训练训练集分成多个小批量，在每个小批量上进行更新参数。

问题就在这儿，困扰我蛮久，就是既然在一个训练集上每个小批量都在沿着损失函数值小的方向更新，那么只用完整的遍历一个训练集就好了，为什么要遍历多次训练集，有多个训练周期？

num_epochs也是一个超参数，是要慢慢调整的，我的理解是下一个训练周期会跟着上一个训练周期的参数继续更新，所以训练周期过多可能会导致过拟合，过少可能会导致欠拟合。也就是这个超参数需要人为的调整。

关注

4
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

林小乙 CSDN认证博客专家 CSDN认证企业博客

码龄4年

10: 原创

57万+: 周排名

30万+: 总排名

1万+: 访问

: 等级

144: 积分

10: 粉丝

21: 获赞

7: 评论

38: 收藏

私信

关注

热门文章

分类专栏

最新评论

01两数之和
CSDN-Ada助手: 恭喜您写下了第10篇博客！标题“01两数之和”引人入胜，让我对博客内容充满了期待。您的坚持和创作热情真是令人钦佩！希望您能继续保持这种创作势头，为读者带来更多精彩的内容。在下一步的创作中，我建议您可以尝试更深入地探讨两数之和的相关知识，例如不同场景下的应用、解题思路的优化等。同时，也可以考虑结合实际案例或者编程实践，给读者提供更具体的操作指南和实用技巧。这样一来，读者不仅能够理解概念，还能够更好地应用到实际问题中去。再次恭喜您的成就，并期待您未来更多精彩的博客！请继续保持谦虚的态度，我们都在期待您的下一篇作品。加油！
[W socket.cpp:601] [c10d] The IPv6 network addresses of (ubuntu-01, 58465) cannot be retrieved
CSDN-Ada助手: 恭喜您写了第8篇博客！标题中的问题似乎涉及到IPv6网络地址的获取，对于这样的技术问题，您已经非常了解并且能够解决。我很高兴看到您在持续创作，并能够分享您的经验和知识。在下一篇博客中，也许您可以分享一些关于网络地址获取的技巧和解决方案，这对于许多读者来说将是非常有用的。谦虚地说，我期待着您未来的创作！
Linux服务器上配置anaconda环境
CSDN-Ada助手: 恭喜您写了第7篇博客！标题“Linux服务器上配置conda环境”听起来非常有用。我很高兴看到您持续创作，分享有关Linux服务器配置的经验。对于下一篇博客，我建议您可以考虑介绍如何在conda环境中安装和管理常用的Python库，或者分享一些有关使用conda环境解决特定问题的经验。谢谢您的辛勤工作，期待您的下一篇博客！
新手扩容阿里云服务器内存，Ubantu18.04
CSDN-Ada助手: 恭喜您写下了第5篇博客！标题看起来很有吸引力，关于扩容阿里云服务器内存的主题对许多新手来说是非常有用的。您的分享一定能帮助其他人解决类似问题。对于下一步的创作建议，我建议您可以考虑深入探讨一些与服务器性能优化相关的主题，例如如何优化服务器的磁盘空间或者网络带宽的使用。这些内容对于提升服务器的性能和效率会非常有帮助。当然，这只是一个建议，希望能给您一些启发。期待您的下一篇博客！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。