PyTorch模型训练集正常收敛，但验证集准确率稳定在10%并保持不变

最新推荐文章于 2025-02-12 19:33:06 发布

*pprp*

最新推荐文章于 2025-02-12 19:33:06 发布

阅读量5.3k

点赞数 7

分类专栏：深度学习 Bug处理文章标签： pytorch 深度学习 python

原创文章不要私自转载，自私转载必究责任，如需转载请联系wx:topeijie商谈

本文链接：https://blog.csdn.net/DD_PP_JJ/article/details/126213560

版权

深度学习同时被 2 个专栏收录

62 篇文章

订阅专栏

2 篇文章

订阅专栏

问题描述

训练过程中遇到的一个Bug，可能是跟Torch本身有关，如下图和题目所示，经过多轮训练，训练准确率开始收敛，但是验证准确率保持在10%左右不变。

在这里插入图片描述

排查手册

一般来说这表示模型本身可能存在问题，下面列出一个排查手册：

检查是否是数据问题，将验证集数据替换为训练数据，查看是否训练正常。
检查数据增强是否正常。
学习率是否设置过大，降低学习率防止过大的波动。
调整模型初始化方式，检查是否正常初始化模型。
BN带来的问题，BN会导致数据分布不一致。

最终解决

实际上最终发现，在进行验证集测试的过程中，将model.eval() 注释掉，即可正常训练，这个很可能是某些版本torch中存在的隐藏Bug。

在这里插入图片描述

版本避坑

在这里插入图片描述

参考文献

https://github.com/apache/incubator-mxnet/issues/1968
https://blog.csdn.net/jbddygb/article/details/53365218

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

*pprp* 如果有帮助可以打赏一杯咖啡

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。