batchsize大小对训练速度的影响

最新推荐文章于 2024-06-17 22:30:00 发布

Golden-sun

最新推荐文章于 2024-06-17 22:30:00 发布

阅读量2.7w

点赞数 36

分类专栏： pytorch 文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_43402775/article/details/108960129

版权

23 篇文章 2 订阅

订阅专栏

1.batchsize越大是不是训练越快？

GPU :一块2080Ti
平台：pytorch cuda
图片数量：2700

batchsize	一个图片处理时间	GPU内存占用	GPU算力使用	一个epoch 所用时间
1	0.117s	2.5G	20%	2700 * 0.0117 = 318s
5	0.516s	8G	90%	2700 * 0.516/5 = 279s

batchsize大了之后，占用的资源多了，算力多了，但是速度没有提升，这样是不是太坑了。
我们其实可以把 batchsize设置小点，然后把剩余的内存跑其他实验，而且再在同一张卡上跑一个新的实验，对之前的速度也没有影响。

结论：
1.本人实验 batchsize越大，训练速度提升不大
2.bachsize小点，多跑几个实验真香

完成每个epoch运算的所需的全部时间主要卡在：

load数据的时间，
每个epoch的iter数量。
因此对于每个epoch，不管是纯计算时间还是全部时间，大体上还是大batch能够更节约时间一点，但随着batch增大，iter次数减小，完成每个epoch的时间更取决于加载数据所需的时间，此时也不见得大batch能带来多少的速度增益了。

收集资料发现，确实是这样的，但是也不能太大了

在这里插入图片描述

关注

专栏目录