神经网络训练曲线分析：loss与val_loss 先上升后下降

最新推荐文章于 2025-03-03 08:03:54 发布

依夏c

最新推荐文章于 2025-03-03 08:03:54 发布

阅读量897

点赞数 3

文章标签：神经网络人工智能深度学习

本文链接：https://blog.csdn.net/m0_67549907/article/details/141968531

版权

如图，对于val_loss和train_loss在训练初期出现上升，而后逐渐下降的情况是正常现象。

其原因是：带momentum的方法训练，可看作在参数值和momentum组成的二元组上，每步乘一个矩阵，然后加一个噪音。不发散，要求这个矩阵的特征值范数小于1.但是，可能有复特征值和复特征向量。一个单位实向量分解为两个复特征向量的线性组合，系数可能是大于1的。所以，虽然系数在衰减，但复的部分可能被变换到实的部分来，就出现初期loss上升的情况，直到模最大的系数被衰减到1以下。综上，初期loss上升，不一定发散，是正常的。在不带momentum的情况下，一般不应该出现这种情况。