神经网络与深度学习---验证集（测试集）准确率高于训练集准确率的原因

最新推荐文章于 2024-08-30 22:27:12 发布

小天才才

最新推荐文章于 2024-08-30 22:27:12 发布

阅读量3.5w

点赞数 44

分类专栏： # 课外知识学习文章标签：神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44528283/article/details/111732051

版权

课外知识学习专栏收录该内容

5 篇文章

订阅专栏

博客分析了训练集准确率低于验证集的原因。一是数据集太小，切分不均匀致训练集和测试集分布不同；二是模型正则化过多，如dropout在训练和验证时表现不同；三是训练集和验证集准确率计算时机有差异；四是训练集过多预处理改变了数据分布。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.数据集太小，这样会导致数据集切分的时候不均匀，也就是说训练集和测试集的分布不均匀，如果模型能够正确地捕捉到数据内部的分布模式的话，就有可能造成训练集的内部方差大于验证集，会造成训练集的误差更大，这个时候就需要重新划分数据集，使其分布一样。

2.模型正则化过多，比如训练时dropout过多，和验证时的模型相差较大，验证时是不会有dropout的。

Dropout能基本上确保测试集的准确性最好，优于训练集的准确性。Dropout迫使神经网络成为一个非常大的弱分类器集合，这就意味着，一个单独的分类器没有太高的分类准确性，只有当把他们串在一起的时候他们才会变得更强大。

而且在训练期间，Dropout将这些分类器的随机集合切掉，因此，训练准确率将受到影响；在测试期间，Dropout将自动关闭，并允许使用神经网络中的所有弱分类器，因此，测试精度提高。

3.训练集的准确率是每个batch之后产生的，而验证集的准确率一般是一个epoch后产生的，验证时的模型是训练一个个batch之后的，有一个滞后性，可以说就是用训练得差不多的模型用来验证，当然准确率要高一点。

4.训练集的数据做了一系列的预处理，如旋转、仿射、模糊、添加噪点等操作，过多的预处理导致训练集的分布产生了变化，所以使得训练集的准确率低于验证集

评论 20

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小天才才 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。