DN-DETR

主要是引入了去噪(class、bbox重建)的辅助任务
在这里插入图片描述
在Decoder部分,除了anchor的embedding,还加入了带噪声的bbox和class,比如gt_bbox
是(x, y, h, w),加噪声可以有很多种方式,比如变成 ( x + Δ x , y + Δ y , h + Δ h , w + Δ w ) (x+\Delta{x}, y+\Delta{y}, h+\Delta{h}, w+\Delta{w}) (x+Δx,y+Δy,h+Δh,w+Δw),label加噪声的话就是随机变成别的class label,要求Decoder输出对应的GT bbox或者Class label。

每个group代表一种加噪声模式,每个group包含M个加噪声后的Query,M是这张图片上gt的数量

结果:加速训练50%,效果还是挺显著的。相当于对每个img引入了更多的sample/数据增强来增强对Decoder的训练,只是成本比较低

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值