CNN基础——如何设置BatchSize，2024年Python高级面试题总结

最新推荐文章于 2024-09-11 20:02:17 发布

2401_84006689

最新推荐文章于 2024-09-11 20:02:17 发布

阅读量944

点赞数 16

分类专栏： 2024年程序员学习文章标签： python cnn 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84006689/article/details/137216725

版权

本文探讨了在卷积神经网络（CNN）中Batch Size的重要性。它影响模型优化速度和GPU内存使用，合适的Batch Size能平衡训练速度与精度。过大可能导致内存不足，过小则可能造成训练不收敛。通常，Mini-batch在几十或几百的大小是常见选择，且2的幂次能更好地利用GPU性能。调整Batch Size需考虑样本数量、训练速度和收敛精度，以找到时间和精度的最佳平衡点。

摘要由CSDN通过智能技术生成

Batch Size的直观理解就是一次训练所选取的样本数。

Batch Size的大小影响模型的优化程度和速度。同时其直接影响到GPU内存的使用情况，假如你GPU内存不大，该数值最好设置小一点。

2、为什么需要 Batch_Size？

=====================

在没有使用Batch Size之前，这意味着网络在训练时，是一次把所有的数据（整个数据库）输入网络中，然后计算它们的梯度进行反向传播，由于在计算梯度时使用了整个数据库，所以计算得到的梯度方向更为准确。但在这情况下，计算得到不同梯度值差别巨大，难以使用一个全局的学习率，所以这时一般使用Rprop这种基于梯度符号的训练算法，单独进行梯度更新。

在小样本数的数据库中，不使用Batch Size是可行的，而且效果也很好。但是一旦是大型的数据库，一次性把所有数据输进网络，肯定会引起内存的爆炸。所以就提出Batch Size的概念。

3、如何设置Batch_Size 的值？

======================

假如每次只训练一个样本，即 Batch_Size = 1。线性神经元在均方误差代价函数的错误面是一个抛物面，横截面是椭圆。对于多层神经元、非线性网络，在局部依然近似是抛物面。此时，每次修正方向以各自样本的梯度方向修正，横冲直撞各自为政，难以达到收敛。

最低0.47元/天解锁文章

关注

16
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。