神经网络训练中，Epoch、Batch Size和迭代傻傻分不清?

最新推荐文章于 2024-03-19 13:35:55 发布

Monster_H777

最新推荐文章于 2024-03-19 13:35:55 发布

阅读量1k

点赞数 1

分类专栏：卷积神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Monster_H7/article/details/103289521

版权

深度学习同时被 2 个专栏收录

15 篇文章 0 订阅

订阅专栏

卷积神经网络

14 篇文章 0 订阅

订阅专栏

今天让我们来总结下训练神经网络中最最基础的三个概念：Epoch, Batch, Iteration。

1. 名词解释

2. 换算关系

实际上，梯度下降的几种方式的根本区别就在于上面公式中的 Batch Size不同。

*注：上表中 Mini-Batch 的 Batch 个数为 N / B + 1 是针对未整除的情况。整除则是 N / B。

补充：

为什么要使用多于一个 epoch？

我知道这刚开始听起来会很奇怪，在神经网络中传递完整的数据集一次是不够的，而且我们需要将完整的数据集在同样的神经网络中传递多次。但是请记住，我们使用的是有限的数据集，并且我们使用一个迭代过程即梯度下降，优化学习过程和图示。因此仅仅更新权重一次或者说使用一个 epoch 是不够的。

随着 epoch 数量增加，神经网络中的权重的更新次数也增加，曲线从欠拟合变得过拟合。

那么，几个 epoch 才是合适的呢？

不幸的是，这个问题并没有正确的答案。对于不同的数据集，答案是不一样的。但是数据的多样性会影响合适的 epoch 的数量。比如，只有黑色的猫的数据集，以及有各种颜色的猫的数据集。

3. 示例

CIFAR10 数据集有 50000 张训练图片，10000 张测试图片。现在选择 Batch Size = 256 对模型进行训练。

每个 Epoch 要训练的图片数量：50000
训练集具有的 Batch 个数：50000/256=195+1
- 每个 Epoch 需要完成的 Batch 个数：196
- 每个 Epoch 具有的 Iteration （迭代）个数：196
- 每个 Epoch 中发生模型权重更新的次数：196
- 训练 10 代后，模型权重更新的次数：196*10=1960
- 不同代的训练，其实用的是同一个训练集的数据。第 1 代和第 10 代虽然用的都是训练集的五万张图片，但是对模型的权重更新值却是完全不同的。因为不同代的模型处于代价函数空间上的不同位置，模型的训练代越靠后，越接近谷底，其代价越小。

参考1：https://zhuanlan.zhihu.com/p/29409502

参考2:https://towardsdatascience.com/epoch-vs-iterations-vs-batch-size-4dfb9c7ce9c9

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Monster_H777 CSDN认证博客专家 CSDN认证企业博客

码龄6年

66: 原创

7603: 周排名

5万+: 总排名

28万+: 访问

: 等级

1853: 积分

9243: 粉丝

204: 获赞

47: 评论

1071: 收藏

私信

关注

热门文章

分类专栏

头疼C++ 2篇
Qt 18篇
笔记 1篇
Docker不必 1篇
深度学习 15篇
卷积神经网络 14篇
python 19篇
git 5篇
Linux 14篇
图像处理 5篇

最新评论

【Qt编译】ARM环境 Qt5.14.2-QtWebEngine库编译（完整版）
不知名大白: 请问是不是树莓派32位系统无法安装pyqtwebengine呢
【Qt编译】ARM环境 Qt5.14.2-QtWebEngine库编译（完整版）
stronger007: 请问博主4.2的没有Qt WebEngine Build Tools , 只有Qt WebEngine: Embedded build ......................... yes Pepper Plugins ......................... no Printing and PDF ....................... no Proprietary Codecs ..................... no Spellchecker ........................... yes Native Spellchecker .................... no WebRTC ................................. no Use System Ninja ....................... yes Geolocation ............................ yes WebChannel support ..................... yes Use v8 snapshot ........................ yes Kerberos Authentication ................ no Building v8 snapshot supported ......... yes Use ALSA ............................... yes Use PulseAudio ......................... no Optional system libraries used: 请问知道哪里弄错了吗
【Qt编译】ARM环境 Qt5.14.2-QtWebEngine库编译（完整版）
房东不养猫: 编译Qwebengine实在是太痛苦了
【Qt编译】ARM环境 Qt5.14.2-QtWebEngine库编译（完整版）
房东不养猫: 博主这个单独编译的库以后怎么调用
【Qt编译】ARM环境 Qt5.14.2-QtWebEngine库编译（完整版）
反斜杠\: qtwebengine/src/3rdparty/chromium/tools/gn/out/Release/gn：无法执行二进制文件: 可执行文件格式错误，这个有遇到过吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Monster_H777 我直说吧：你的奖励我的动力～

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。