文章首发见博客:https://mwhls.top/4901.html。
无图/格式错误/后续更新请见首发页。
更多更新请到mwhls.top查看
欢迎留言提问或批评建议,私信不回。
昨天还以为这个月无活可整,没想到第二天就来事了,下个月还好久,留到下月发也不大好( º﹃º )。
问题描述
- 使用MMDetection训练实例分割,训练可执行,测试可执行,但
loss_rpn_bbox
为nan
,loss_bbox
却有值。 - 评估时,少数模型能获得0.1的精度,但无法随训练次数上升而提高。
- 使用faster rcnn或mask2former,四个backbone,都出现上述问题。
故障原因
- 标签尺寸与图像尺寸不匹配。
- 例如,图像为
700x700
的大小,而annotations/trainval.json
里的大小却为3840x2160
,且所有segmentation, bbox的标签,都是以3840x2160
为参考(即取值为[0, 3840])
- 例如,图像为