【小记】BatchSize的数值是设置的越大越好吗

最新推荐文章于 2024-03-30 04:35:22 发布

一位不愿透漏姓氏的许先森

最新推荐文章于 2024-03-30 04:35:22 发布

阅读量1w

点赞数 16

分类专栏：深度学习训练小记文章标签：深度学习人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/vibration_xu/article/details/126267108

版权

深度学习训练小记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

BatchSize的数值并不是设置的越大越好

通常我们可能会认为设置较大的batchsize时，模型的训练效果会比较好。原因有以下几点：

1、模型由于每次得到较多的训练数据，模型的下降方向会更加准确，模型训练曲线会更加平滑。

2、减少了训练时间。同样的epoch时，batchsize需要的batch数目减少了，所以处理速度变快了。

但是啊但是，

较大的batchsize有以下几点问题需要注意：

1、内存问题。较大的batch可能会造成内存/显存溢出

2、泛化能力下降。这一点是我之前没有考虑到的一点。使用太大的批处理大小可能会在训练期间对网络的准确性产生负面影响，因为它减少了梯度下降的随机性。

使用较小的批处理大小产生更不稳定、更随机的权重更新。这有两个积极的影响。首先，它可以帮助训练“跳出”之前可能陷入的局部最小值，其次，它可以使训练稳定在“更平坦”的最小值，这通常表明泛化性能更好。

怎么选取训练神经网络时的Batch size? - 知乎 (zhihu.com)

上面这篇链接里(侵删)指出：

当有足够算力时，选取batch size为32或更小一些。
算力不够时，在效率和泛化性之间做trade-off，尽量选择更小的batch size。
当模型训练到尾声，想更精细化地提高成绩（比如论文实验/比赛到最后），有一个有用的trick，就是设置batch size为1，即做纯SGD，慢慢把error磨低。

一位不愿透漏姓氏的许先森

关注

16
点赞
踩
42

收藏

觉得还不错? 一键收藏
打赏
0
评论
【小记】BatchSize的数值是设置的越大越好吗

显存大就一定好吗？batchsize开64？你觉得很帅的时候有人却告诉你这是荒唐的~
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

一位不愿透漏姓氏的许先森 你的鼓励是我最大的动力！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。