batchsize大小对网络模型的理解

最新推荐文章于 2024-04-20 21:35:06 发布

码农研究僧

最新推荐文章于 2024-04-20 21:35:06 发布

阅读量1.1k

点赞数

分类专栏：深度学习文章标签：机器学习深度学习人工智能

本文链接：https://blog.csdn.net/weixin_47872288/article/details/128517121

版权

25 篇文章 19 订阅

订阅专栏

前言

每一次的epoch都是将其数据集经过神经网络，进行正向传播以及反向传播。由于epoch训练的数据集可能过大，需要将其分块，对应设置batchsize的尺寸个数。

训练数据的时候，batchsize的大小会影响精确度以及训练的时长问题等

batchsize大小的选择，介于1到数据总量之间，选择过大或者过小都会出现极端。过小可能出现欠拟合，过大可能出现过拟合，具体选择多少的batchsize根据网络以及数据集来决定

batchsize的大小决定梯度下降的方向和大小

更新权重的通过每次epoch的训练，batchsize设置为1的时候只用1个样本更新参数，batchsize设置为2的时候只用2个样本更新参数。权重的更新影响梯度下降的方向和大小。

batchsize的大小	优点	缺点
过小（假设为1）	只适用小样本数据	- 耗时：当数据总量较大，每次训练只用1个数据，时长会非常大。 - 难收敛：个体差异会引起梯度难以下降，模型难以收敛，容易欠拟合
过大（假设为数据总量）	- 省时：多个数据训练减少所需的batch	- 内存溢出：每次都这么大数据量，可能导致内存溢出。 - 其他：参数难以修正，梯度下降方向已确定，无法有细微变化

过拟合：

在这里插入图片描述

神经网络训练数据的时候一般选择合适的batchsize，大的batchsize可以提高稳定性，梯度下降的时候可以更加稳定，不过不是极端的大，要适合自身的网络模型还有数据量

选择合适的batchsize下降方向比较准确，训练引起的波动较小，整体的下降方向通过微调即可

选择合适的batchsize的优点：

关注