CNN基础——如何设置BatchSize，2024年华为Python面试真题解析

最新推荐文章于 2024-04-28 18:14:01 发布

前端小仙子

最新推荐文章于 2024-04-28 18:14:01 发布

阅读量785

点赞数 22

分类专栏： 2024年程序员学习文章标签： cnn python 面试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_60388216/article/details/136893732

版权

本文探讨了在CNN模型训练中设置BatchSize的重要性和策略。内容包括BatchSize对模型收敛速度和精度的影响，以及如何根据GPU资源和训练集大小调整BatchSize。同时，建议在实践中先尝试较大的BatchSize，根据Loss收敛情况逐步调整，以找到时间和精度的平衡点。

摘要由CSDN通过智能技术生成

1）batch数太小，而类别又比较多的时候，真的可能会导致loss函数震荡而不收敛，尤其是在你的网络比较复杂的时候。

2）随着batchsize增大，处理相同的数据量的速度越快。

3）随着batchsize增大，达到相同精度所需要的epoch数量越来越多。

4）由于上述两种因素的矛盾， Batch_Size 增大到某个时候，达到时间上的最优。

5）由于最终收敛精度会陷入不同的局部极值，因此 Batch_Size 增大到某些时候，达到最终收敛精度上的最优。

6）过大的batchsize的结果是网络很容易收敛到一些不好的局部最优点。同样太小的batch也存在一些问题，比如训练速度很慢，训练不容易收敛等。

7）具体的batch size的选取和训练集的样本数目相关。

8）GPU对2的幂次的batch可以发挥更佳的性能，因此设置成16、32、64、128…时往往要比设置为整10、整100的倍数时表现更优

我在设置BatchSize的时候，首先选择大点的BatchSize把GPU占满，观察Loss收敛的情况，如果不收敛，或者收敛效果不好则降低BatchSize，一般常用16，32，64等。

4、在合理范围内，增大Batch_Size有何好处？

===========================

内存利用率提高了，大矩阵乘法的并行化效率提高。
<

最低0.47元/天解锁文章

前端小仙子

关注

22
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
CNN基础——如何设置BatchSize，2024年华为Python面试真题解析

这是我花了几天的时间去把Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。4）由于上述两种因素的矛盾， Batch_Size 增大到某个时候，达到时间上的最优。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。