epoch训练时间不同_epoch、batch size和iterations

最新推荐文章于 2024-05-30 21:58:15 发布

弹吉他的胖达

最新推荐文章于 2024-05-30 21:58:15 发布

阅读量3k

点赞数

文章标签： epoch训练时间不同

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_33783273/article/details/112949981

版权

1.epoch和batch size含义

以mnist数据集为例，有60000张训练图片和10000张测试图片。

1个epoch指的是训练时将60000张训练图片训练一次。

假设选择batch size=100对模型进行训练。

每个epoch具有的iteration个数为600。

2.epoch和batch size大小选择

2.1 epoch大小选择

对于不同的任务和不同规模的训练集，epoch数量是不同的。一般首先使用训练集训练模型，然后在验证集上评估模型的性能，随着epoch增加，模型在验证集的效果会变好，但如果训练太多epoch，会导致模型过度拟合训练数据，验证集的效果会下降，理想情况下，我们想找到模型由好变坏的拐点，现在主流的技术是early stopping机制，通过loss的变化来决定是否停止训练，最终，我们使用这个最好的模型在测试集上进行推理，这是规范的一套流程。

2.2 batch size大小选择

显存占用=模型显存占用+batch_size x 每个样本的显存占用。

对于大数据集，因为显存和算力限制，无法将所有数据一次性用于模型训练。此外，如果仅仅使用几条数据进行训练，导致更新点横冲直撞，无法完成收敛。所以，实际训练时是将一些数据组成一个batch送入网络，下图是别人做的一个实验，对batch的大小进行参数控制，得到了一些运行指标。图1 batch大小对模型性能的影响

从图1中可以看到：

(1)batch_size太小

最低0.47元/天解锁文章

弹吉他的胖达

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
epoch训练时间不同_epoch、batch size和iterations

1.epoch和batch size含义以mnist数据集为例，有60000张训练图片和10000张测试图片。1个epoch指的是训练时将60000张训练图片训练一次。假设选择batch size=100对模型进行训练。每个epoch具有的iteration个数为600。2.epoch和batch size大小选择2.1 epoch大小选择对于不同的任务和不同规模的训练集，epoch数量是不同的。...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。