End-to-End Object Detection with Transformers论文解析

C_zeh

于 2024-01-18 15:26:20 发布

阅读量953

点赞数 23

文章标签：目标检测 transformer 计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_48382447/article/details/135674069

版权

传统方法存在的问题

目标检测领域，从目标检测开始火到detr（Detection Transformers）都很少有端到端的方法，大部分方法最后至少需要后处理操作（NMS,non-maximum suppression非极大值抑制）。无论是proposal based方法、anchor based方法、non-anchor based方法，最后都会生成很多预测框，如何去除这些冗余的框就是NMS要做的事情。由于使用了NMS所以会出现以下两个问题：

1.有了NMS，模型调参就会很复杂

2.即使训练好了一个模型，部署起来也非常困难（NMS不是所有硬件都支持）

Detr的介绍

在这篇文章中提出了一种新的方法，将目标检测看做是集合预测问题。这个方法简化了检测流程，有效地消除了许多自己设计的组件，比如非极大值抑制程序（NMS）或显式编码我们对任务的先验知识的锚点（anchor）生成。

新框架的主要组成部分被称为Detection Transformer或DETR，其中包括一种基于集合的全局损失，通过二分图匹配强制进行唯一预测，以及一个Transformer编码器-解码器架构。给定一组固定的学习对象查询，DETR通过推理对象之间的关系和全局图像上下文，直接并行输出最终的预测集。

有了这种全局建模的能力，detr不会有那么多冗余框，最后出什么结果就是什么结果，detr也不需要NMS做后处理，让模型的训练和部署都简单了很多。

所以detr是一个简单的，端到端的模型。

Detr的主要贡献

1、把目标检测做成一个端到端的框架。

2、提出了新的目标函数，通过二分图匹配的方式，能够强制模型输出一组独一无二的预测。

3、使用了Transformer encoder-decoder的架构。

Detr训练流程及预测步骤

第一步：用卷积神经网络

最低0.47元/天解锁文章

关注

23
点赞
踩
18

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

C_zeh CSDN认证博客专家 CSDN认证企业博客

码龄4年

1: 原创

208万+: 周排名

29万+: 总排名

953: 访问

: 等级

34: 积分

0: 粉丝

23: 获赞

1: 评论

18: 收藏

私信

关注

热门文章

End-to-End Object Detection with Transformers论文解析 953

最新评论

End-to-End Object Detection with Transformers论文解析
CSDN-Ada助手: 恭喜你开始撰写博客，这是一个很好的开始！你对“End-to-End Object Detection with Transformers”论文进行了深入的解析，让读者对这一主题有了更深入的了解。接下来，我建议你可以尝试添加一些实际的案例或者应用场景，让读者更容易理解论文中的概念和方法。希望你能继续创作，分享更多有价值的内容！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
End-to-End Object Detection with Transformers论文解析
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/617959715。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。