【深度学习】验证集的loss小于训练集的loss的原因分析

最新推荐文章于 2025-04-06 17:12:43 发布

若初见zl

最新推荐文章于 2025-04-06 17:12:43 发布

阅读量1.6w

点赞数 14

分类专栏：深度学习文章标签：深度学习机器学习人工智能神经网络 tensorflow

本文链接：https://blog.csdn.net/qq_34461637/article/details/106764573

版权

深度学习专栏收录该内容

1 篇文章

订阅专栏

原因1：在训练过程中应用正则化，但在验证/测试过程中未进行正则化。

解决方法：如果在验证/测试期间添加正则化损失，则损失值和曲线将看起来更加相似。

在训练深度神经网络时，我们经常应用正则化来帮助我们的模型：

获得更高的验证/测试精度
理想情况下，为了更好地泛化验证和测试集之外的数据

正则化方法通常会牺牲训练准确性来提高验证/测试准确性，在某些情况下，这可能导致您的验证损失低于训练损失。

其次，请记住，在验证/测试时不应用诸如 dropout 之类的正则化方法。

考虑对验证 loss 进行正则化处理（例如，在验证/测试过程中应用 dropout）可以使您的训练/验证 loss 曲线看起来更相似。（这句看不懂，不知道怎么在验证/测试过程中加入 dropout 之类的正则化处理，有明白的麻烦告诉我一下 (T＿T) ）

原因2：训练loss是在每个epoch过程中测量的，而验证loss是在每个epoch后测量的。

解决方法：平均而言，训练损失的测量时间是前一个时期的1/2。如果将训练loss曲线向左移动半个epoch，则 loss 会更好。

plt.style.use("ggplot")
(fig, axs) = plt.subplots(2, 1)

# plot the *unshifted* training and validation loss
plt.style.use("ggplot")
axs[0].plot(epochs, train_history["loss"], label="train_loss")
axs[0].plot(epochs, train_history["val_loss"], label="val_loss")
axs[0].set_title("Unshifted Loss Plot")
axs[0].set_xlabel("Epoch #")
axs[0].set_ylabel("Loss")
axs[0].legend()

# plot the *shifted* training and validation loss
axs[1].plot(epochs - 0.5, H["loss"], label="train_loss")
axs[1].plot(epochs, H["val_loss"], label="val_loss")
axs[1].set_title("Shifted Loss Plot")
axs[1].set_xlabel("Epoch #")
axs[1].set_ylabel("Loss")
axs[1].legend()
   
# show the plots
plt.tight_layout()
plt.show()