关于DETR模型训练自定义数据集AP=0问题

在使用DETR模型进行训练过程时,其在每次训练完成后都会进行评估,但在运行过程中,博主发现其AP值始终都为0,如下图:

在这里插入图片描述

刚开始时,博主还以为是初始训练的问题,后来进行了6个轮次后结果依旧没有改变,此时以为是数据集的类别与编号没有对应造成的,但经过排查却并非是这个原因。后来在查阅资料时得知这是由于Transformer开始是无方向的,我们需要给它一个预训练权重进行迁移学习。这时博主就很奇怪了,先前不是已经给了ResNet预训练权重了吗,怎么还会要求这个呢,查看了一下服务器的源码也没有发现异常,而在查看GPU使用情况时(如下图),博主此时的batch-size=32,但GPU利用率与显存占用率并不高,这与论文中提到的很吃配置明显是不符的。

在这里插入图片描述

随后博主不再使用服务器,而是转回本地,此时发现运行竟然报错了。

RuntimeError: Error(s) in loading state_dict for DataParallel:
size mismatch for module.lstm_block.lstm.weight_ih_l0: copying a param with shape torch.Size([7, 500]) from checkpoint, the shape in current model is torch.Size([92, 2000]).

这一下给我搞懵了,先前可没有出现过呀。后来经过梳理先前的过程,发现是自己的类别配置出了问题。

在这里插入图片描述

修改后再次运行,不再报错,也可以运行了,但缺依旧没有解决AP=0的问题。很苦恼。

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 15
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

彭祥.

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值