batch size浅谈

最新推荐文章于 2024-06-24 15:01:40 发布

kendyChina

最新推荐文章于 2024-06-24 15:01:40 发布

阅读量1.5k

点赞数

分类专栏：深度学习文章标签： batch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/MacKendy/article/details/108789510

版权

深度学习专栏收录该内容

18 篇文章 2 订阅

订阅专栏

Batch Size的概念：每个Batch（批次）的大小。
例如所有训练集有1000个样本，每把1000个Sample跑完就是一个epoch。那么在一个epoch中，同时取多少个sample进行训练，就是batch size。

当今神经网络的训练中，所需要的训练集是非常庞大的，因此我们没办法一次性把所有训练集放进内存或显存中，统一训练。
在同时训练的数量差别上，分三种类型：

batch size=1；
batch size=n （dataset > n > 1）；
batch size=size(DataSet)。

第一种情况是极端的每次只同时训练一个样本，第三种情况是极端的每次同时训练所有样本。
通常会在两者取折中，以一个mini batch的方式进行训练。而mini batch的大小即batch size。

Batch Size越大，相对于训练集的偏差（bias）则越小，则每次优化的方向更贴近整体训练集的大方向。
反观BatchSize=1的情况下，每次训练的偏差都较大，模型训练的过程容易抖动（Zig-zag），且训练的速度变慢。

在目前基本属于标配的Batch Normalization组件，是在每个Batch下的Channel进行归一化，且根据论文Group Normalization的实验表明，Batch Size的增大是有助于含BN层的模型优化的。
在这里插入图片描述

Batch Size虽越大越好，但通常会使用 $2^n$ 作为Size。因为GPU的物理处理器通常是 $2^n$ 个，这样Samples可以和GPU的物理处理器对齐，最大化使用GPU的计算资源。

参考文献：
What is batch size in neural network?
Is using batch size as ‘powers of 2’ faster on tensorflow?

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
batch size浅谈

Batch Size的概念：每个Batch（批次）的大小。例如所有训练集有1000个样本，每把1000个Sample跑完就是一个epoch。那么在一个epoch中，同时取多少个sample进行训练，就是batch size。当今神经网络的训练中，所需要的训练集是非常庞大的，因此我们没办法一次性把所有训练集放进内存或显存中，统一训练。在同时训练的数量差别上，分三种类型：batch size=1；batch size=n （dataset > n > 1）；batch size=siz
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。