batch size 训练时间_深度学习 | Batch Size对训练的影响(二)

本文探讨了Batch Size在深度学习训练中的作用,指出它不仅影响收敛速度,还可能影响目标函数的最优解。增大Batch Size可能导致训练更快但梯度平滑,可能陷入局部最优;小Batch Size虽有助于跳出局部最优,但可能导致BN层效果不稳定。此外,超大Batch可能存在训练效率与收敛质量的权衡问题。
摘要由CSDN通过智能技术生成

3bdc4e10a24b5cdb871b96ec28661ed1.png

之前转载过他人对于Batch Size对训练的影响的研究。但是其实描述的还不是很完善,最近刚好有空,写一篇我在深度学习过程中Batch Size对训练过程的影响。

安小飞:深度学习 | Batch Size大小对训练过程的影响​zhuanlan.zhihu.com

在实际深度学习项目中,一般有三种抽取数据的方式,第一种是取全量的数据进行梯度的更新;第二种是取1条样本进行每次迭代更新,即在线学习batch size=1;第三种是取部分样本数据也就是mini batch size进行梯度更新。三种方式对梯度更新也很容易想到,第一种因为是全量数据,所以梯度总能朝正确的方向进行下降;第二种为one by one,梯度的游走路径波动显然会很大;第三种是一种折中的方式,而我们需要做的就是找到第三种方式最优值。

所以我们要明白Batch Size到底影响的是什么?显而易见的是它会影响目标函数的收敛速度,一般来说,增大Batch_Size,所带来的训练时的标准差并不是线性增长的,比如训练一个样本的标准差为σ,那么取Batch_Size=n所带来的标准差为

,而非
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值