理解 batch是一次处理的数据集,在训练的时候,将batch个数据的损失取平均,用于梯度下降算法。epoch是训练的次数,每次epoch会完成 样本数量/batch 的反向传播,更新参数 实例 假设有一个包含200个样本的数据集,选择的Batch大小为5和1,000个Epoch。则共有40个Batch,每个Batch有5个样本。每批五个样品后,模型权重将更新。一个epoch将涉及40个Batch或40个模型更新。