神经网络专业术语解释（Step， Batch Size， Iteration，Epoch）

最新推荐文章于 2024-09-18 11:31:49 发布

Elvirangel

最新推荐文章于 2024-09-18 11:31:49 发布

阅读量894

点赞数 2

分类专栏： Python语法注意点深度学习文章标签：神经网络术语

Python语法注意点同时被 2 个专栏收录

75 篇文章 5 订阅

订阅专栏

29 篇文章 0 订阅

订阅专栏

原文：https://blog.csdn.net/tracylining/article/details/80781937

1. 名词解释

Step: 训练模型的步数

Batch Size（批尺寸）：计算梯度所需的样本数量，太小会导致效率低下，无法收敛。太大会导致内存撑不住，Batch Size增大到一定程度后，其下降方向变化很小了，所以Batch Size是一个很重要的参数。

Epoch（回合）：代表样本集内所有的数据经过了一次训练。

Iteration（迭代）：

理解迭代，只需要知道乘法表或者一个计算器就可以了。迭代是 batch 需要完成一个 epoch 的次数。记住：在一个 epoch 中，batch 数和迭代数是相等的。

比如对于一个有 2000 个训练样本的数据集。将 2000 个样本分成大小为 500 的 batch，那么完成一个 epoch 需要 4 个 iteration。

下面的内容转自https://blog.csdn.net/lhhopencv/article/details/78912256

2. 换算关系

$\mathbf{Number ~ of ~ Batches = \frac{Training ~ Set ~ Size}{Batch ~ Size}}$

实际上，梯度下降的几种方式的根本区别就在于上面公式中的 Batch Size不同。

*注：上表中 Mini-Batch 的 Batch 个数为 N / B + 1 是针对未整除的情况。整除则是 N / B。

3. 例子

CIFAR10 数据集有 50000 张训练图片，10000 张测试图片。现在选择 Batch Size = 256 对模型进行训练。

每个 Epoch 要训练的图片数量：
训练集具有的 Batch 个数：
每个 Epoch 需要完成的 Batch 个数：
每个 Epoch 具有的 Iteration 个数：
每个 Epoch 中发生模型权重更新的次数：
训练代后，模型权重更新的次数：
不同代的训练，其实用的是同一个训练集的数据。第代和第代虽然用的都是训练集的五万张图片，但是对模型的权重更新值却是完全不同的。因为不同代的模型处于代价函数空间上的不同位置，模型的训练代越靠后，越接近谷底，其代价越小。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。