训练过程中验证精度高于训练精度可能的原因

最新推荐文章于 2024-04-03 15:38:19 发布

Kelly_Ai_Bai

最新推荐文章于 2024-04-03 15:38:19 发布

阅读量1.6k

点赞数 10

分类专栏：网络模型训练的问题文章标签：深度学习人工智能图像处理神经网络 pycharm

本文链接：https://blog.csdn.net/Kelly_Ai_Bai/article/details/135373340

版权

网络模型训练的问题专栏收录该内容

1 篇文章 0 订阅

订阅专栏

可能的原因：

1. 在数据集很大的时候，loss下降很明显。train loss是平均一个epoch内的所有loss，比如第一个epoch的loss是2.3,2.2,2.1...0.7,0.6 平均train loss是1.5，而val的时候是用已经训练了一个epoch的model进行测试的，假设拟合的很好验证集的loss平均是0.7左右，那么这个时候val的平均效果肯定就更好了

2. data augmentation也会导致这样的现象。因为data augmentation的本质就是把训练集变得丰富，制造数据的多样性和学习的困难来让network更robust（比如旋转，随机crop，scale），但是val和test的时候一般是不对数据进行data augmentation的。（有时候会center crop，如果train的时候有crop的话）

3. 也有可能是 drop out的影响，drop out可以理解为随机屏蔽掉一些feature（神经元），只用一部分 feature 来识别，这样留下来的这些feature就更强了。等 test/val 的时候全部神经元一起上，表现就更好了，drop out一般用于fc层中

4. 其实在ImageNet等大数据集训练的前期到中期一直有这样的现象，一般都是最后验证精度才被训练精度反超。其原因就是对参与训练的数据加了很多data argumentation技巧，例如：rescale，随机crop等等，一般不对test/val数据进行数据增强，比如直接进行crop中心操作