Yolo中epoch、batch、batchsize的含义

人small志气tall

已于 2023-07-20 15:00:57 修改

阅读量6k

点赞数

文章标签： YOLO batch 机器学习

于 2023-07-20 14:55:02 首次发布

原文链接：https://zhuanlan.zhihu.com/p/390341772

版权

epoch是指模型对整个训练数据集的一次完整遍历，每个epoch中模型会通过反向传播更新权重。Batch是数据集的子集，BatchSize定义每次训练的样本数。合适的BatchSize能平衡训练速度和准确性，过大可能导致过拟合，过小则可能欠拟合。SGD、Mini-batchSGD和GradientDescent是不同的优化策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

epoch：直接意思为时期。在算法中表示模型对整个训练数据集的一次完整迭代。

在每个epoch中，模型会遍历整个训练数据集一次，通过反向传播和优化算法来更新模型的权重，以最小化损失函数并提高模型的性能。

在YOLOv5中，每个epoch的训练过程中，模型会遍历数据集中的每个批次（batch）数据，并根据损失函数计算预测值与真实标签之间的差异，然后通过反向传播算法来调整模型的参数，以使得模型在下一次遍历数据集时能够更好地预测猴猕猴桃。

需要注意的是，epoch并不是越大越好。过少的epoch可能导致模型欠拟合，而过多的epoch可能导致模型过拟合。因此，通常需要进行实验和调优，找到最佳的epoch数以获得最佳的模型性能。

当一个完整的数据集通过了神经网络一次并且返回了一次，这个过程称为一次 epoch。（也就是说，所有训练样本在神经网络中都进行了一次正向传播和一次反向传播）

再通俗一点，一个Epoch就是将所有训练样本训练一次的过程。

当一个Epoch的样本（也就是所有的训练样本）数量可能太过庞大（对于计算机而言），就需要把它分成多个小块，也就是就是分成多个Batch 来进行训练。

Batch（批 / 一批样本）：

将整个训练样本分成若干个Batch。

Batch_Size（批大小）：

每批样本的大小。

Iteration（一次迭代）：

训练一个Batch就是一次Iteration（这个概念跟程序语言中的迭代器相似）

Batch Size

直观的理解：

Batch Size定义：一次训练所选取的样本数。

Batch Size的大小影响模型的优化程度和速度。同时其直接影响到GPU内存的使用情况，假如GPU内存不大，该数值最好设置小一点。

为什么要提出Batch Size？

在没有使用Batch Size之前，这意味着网络在训练时，是一次把所有的数据（整个数据库）输入网络中，然后计算它们的梯度进行反向传播，由于在计算梯度时使用了整个数据库，所以计算得到的梯度方向更为准确。但在这情况下，计算得到不同梯度值差别巨大，难以使用一个全局的学习率，所以这时一般使用Rprop这种基于梯度符号的训练算法，单独进行梯度更新。

在小样本数的数据库中，不使用Batch Size是可行的，而且效果也很好。但是一旦是大型的数据库，一次性把所有数据输进网络，肯定会引起内存的爆炸。所以就提出Batch Size的概念。