训练过程loss震荡原因与解决办法

最新推荐文章于 2024-05-19 15:58:17 发布

落花逐流水

最新推荐文章于 2024-05-19 15:58:17 发布

阅读量4.3k

点赞数

分类专栏： pytorch实践文章标签：深度学习 pytorch

本文链接：https://blog.csdn.net/juluwangriyue/article/details/120803739

版权

136 篇文章 114 订阅 ¥29.90 ¥99.00

订阅专栏

1、训练的batch_size太小

  当数据量足够大的时候可以适当的减小batch_size,由于数据量太大，内存不够。但盲目减少会导致无法收敛，batch_size=1时为在线学习。

batch的选择，首先决定的是下降方向，如果数据集比较小，则完全可以采用全数据集的形式。这样做的好处有两点，

1）全数据集的方向能够更好的代表样本总体，确定其极值所在。

2）由于不同权重的梯度值差别巨大，因此选取一个全局的学习率很困难。

1）当数据集太大时，内存撑不住。

2）batchsize增大到一定的程度，其确定的下降方向已经基本不再变化。

总结：

    1）batch数太小，而类别又比较多的时候，可能会导致loss函数震荡而不收敛，尤其是在你的网络比较复杂的时候。

    2）随着batchsize增大，处理相同的数据量的速度越快。

    3）随着batchs

了解本专栏

关注