MS-DETR:不用引入额外Decoder分支的one-to-many方法

听枫1122

于 2024-09-18 19:43:52 发布

阅读量1.2k

点赞数 25

文章标签：计算机视觉目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/caiji00001/article/details/142337967

版权

代码地址
 论文地址

目录

摘要
MS-DETR
实验结果

摘要

MS-DETR这篇论文还是用于解决DETR中一对一匹配带来的训练效率低的问题，具体可以去看前面我对H-DETR的介绍。相比于先前的工作，如H-DETR，Group-DETR，这篇论文提出的方法最大的区别就是没有引入额外的decoder分支，从而大大降低了资源消耗。MS-DETR使用一个类似于预测头的模块用于一对多监督，具体方法下面介绍。下面是MS-DETR的效果图：

在这里插入图片描述
从上到下分别是gt，top20queries来自baseline（应该是deformable detr），top20queries来自ms-detr，可以看到整体的候选框效果都变好了。

MS-DETR

关于DETR的架构，大家可以去看原论文，这里就不展开讲了，主要还是讲MS-DETR中提到的新方法。
在这里插入图片描述
如图所示是目前一对多监督的多种思路。a是原始的一对一监督，b就是论文提到的MS-DETR，c是Group-DETR，DN-DETR等方法使用的，d是H-DETR方法使用的。可以看到MS-DETR仍然是在原来的decorder基础上进行的，这也是它与后面两者最大的区别之一。具体实现是怎样的呢？下面具体讲解

一对一监督

一对一监督就是原始的DETR使用的方法，公式如下： $\mathbf{B}=\text{box}_{11}(\tilde{\mathbf{Q}}),\quad\mathbf{S}=\text{cls}_{11}(\tilde{\mathbf{Q}})$ 这里只展示经过decoder layer后的步骤，其中 $\tilde{\mathbf{Q}}$ 是经过decoder layer后的结果，经过两个预测头得到得分与回归框结果，11表示一对一，后面的1m表示一对多。
关于一对一的损失函数，公式如下 $\mathcal{L}_{11}=\sum_{n=1}^N(\ell_{c11}(s_{\sigma(n)},\bar{s}_n)+\ell_{b11}(\mathbf{b}_{\sigma(n)},\bar{\mathbf{b}}_n))$

最低0.47元/天解锁文章

博客等级

码龄5年

16
原创

156
点赞

228
收藏

85
粉丝

关注

私信

热门文章

最新评论

Github可以访问，但是git clone报错443端口连接超时
改不出名字所以开摆: 找了半天资料，终于发现问题所在了，大家如果不知道自己的代理端口，可以WIN+R输入inetcpl.cpl，找到连接选项，在下方局域网设置里就能看到自己的代理是否开启，代理IP地址以及端口号
Relation DETR：改进DETR新的思考角度
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
RT-DETR（在实时检测任务上打败yolo的模型cvpr2024）文章简介
CSDN-Ada助手: 恭喜作者第10篇博客的问世！RT-DETR在实时检测任务上打败yolo的模型cvpr2024，实属了不起之举。希望作者能继续保持创作的热情和努力，不断探索前沿科技，为读者带来更多有价值的内容。或许下一步可以考虑深入探讨RT-DETR的优势和局限性，以及与其他模型的对比分析，为读者提供更全面的视角。期待作者的下一篇作品！
目标检测算法（一）：R-CNN，Fast R-CNN，Faster R-CNN
CSDN-Ada助手: 恭喜作者发布了新的博客！内容涵盖了目标检测算法的介绍，对R-CNN，Fast R-CNN，Faster R-CNN进行了详细的解释，让读者受益匪浅。希望作者在未来的创作中继续保持热情，可以深入探讨不同算法之间的比较、优缺点分析，或者结合实际案例进行讨论，让读者更好地理解和应用这些算法。期待作者的下一篇博客！
如何在GPU服务器（如AutoDL，矩池云）上运行GUI程序
听枫1122: 有设置display的值吗

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。