【MMDetection】ERROR:The testing results of the whole dataset is empty

最新推荐文章于 2025-01-17 15:52:43 发布

there2belief

最新推荐文章于 2025-01-17 15:52:43 发布

阅读量1.6k

点赞数

分类专栏： AI/ML/DL 文章标签：人工智能深度学习机器学习

原文链接：https://blog.csdn.net/fengbao24/article/details/127258699

版权

AI/ML/DL 专栏收录该内容

254 篇文章

订阅专栏

文章讲述了在使用MMdetection复现SwinTransformer论文时遇到的错误——测试结果为空，同时AP、AR等指标为零，F1值为负，loss和grad_norm爆炸。作者排除了数据集问题，推测可能是由于梯度爆炸或消失导致，特别是学习率设置不当。通过将学习率从默认的0.02调整到论文推荐的0.0001，成功解决了问题，使得模型能正常训练。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

问题描述

使用MMdetection复现论文swin Transformer，显示错误：

ERROR:The testing results of the whole dataset is empty

与此同时，各项评价指标如AP,AR结果趋于零，F1值变成-1，loss与grad_norm爆炸增加，具体情形如下图：

问题分析

看到报错的第一眼，猜测可能是数据集的问题，所以检查了数据集的路径，然后检查了数据集里面是否有图片，但经过一番验证，排除了这种可能性。如果数据集本身有问题，代码一开始就无法运行起来，因为mmdet一定会报错，而且报错内容是：找不到数据集或者说找不到某张图片。
再仔细观察报错：ERROR:The testing results of the whole dataset is empty,拿不到测试结果，结合爆炸的loss与grad_morm,我有理由怀疑是梯度爆炸或者梯度消失所导致的。有了这个猜测，我回头审视自己的代码，最有可能导致梯度爆炸的超参数就是学习率lr，是不是我自己设置的学习率lr不合适？
学习率是啥？
学习率是梯度下降多次迭代过程中，用来控制模型学习进度的超参数。可以这么理解，学习率大就学的快（梯度下降块），学习率小就学得慢，但学习率并非越大越好，学习率过大，容易造成梯度爆炸或者消失。

解决办法

MMdetection默认的学习率，大多都是0.02，如果不刻意更改，模型会使用这个学习率去训练，swin Transformer没办法在lr=0.02条件下训练，将学习率更改为论文设定的0.0001，模型就正常训练。
在MMdetection中，学习率的调整是在目录：configs/base/schedules/schedule_1x.py文件中：