2020ECCV 论文（一）End-to-End Object Detection with Transformers

最新推荐文章于 2022-07-20 10:11:53 发布

Nefelibat

最新推荐文章于 2022-07-20 10:11:53 发布

阅读量529

点赞数

分类专栏：计算机视觉论文笔记

本文链接：https://blog.csdn.net/qq_41821067/article/details/108948519

版权

本文介绍了ECCV会议及其在计算机视觉领域的地位，重点讨论了一篇关于使用Transformer进行端到端目标检测的论文——DETR。DETR简化了检测流程，无需非极大抑制或锚点生成，通过集合预测损失和Transformer架构实现直接预测。该模型在COCO数据集上的表现与成熟的Faster R-CNN相当，并能轻松推广到实例分割。DETR的实现代码简洁，约50行PyTorch代码即可完成推理。

摘要由CSDN通过智能技术生成

ECCV是什么

ECCV的全称是European Conference on Computer Vision(欧洲计算机视觉国际会议) ，两年一次，是计算机视觉三大会议（另外两个是ICCV和CVPR）之一。每次会议在全球范围录用论文300篇左右，主要的录用论文都来自美国、欧洲等顶尖实验室及研究所，中国大陆的论文数量一般在10-20篇之间。ECCV2010的论文录取率为27%。
ECCV是一个欧洲会议，欧洲人一般比较看中理论，但是从最近一次会议来看，似乎大家也开始注重应用了，oral里面的demo非常之多，演示效果很好，让人赏心悦目、叹为观止。不过欧洲的会有一个不好，就是他们的人通常英语口音很重，有些人甚至不太会说英文，所以开会和交流的时候，稍微有些费劲。

1 论文初读

1.1 摘要

摘要。提出了一种将目标检测视为直接集预测问题的新方法。我们的方法简化了检测管道，有效地消除了对许多手工设计的组件的需求，如非最大抑制程序或锚生成，这些组件明确地编码了我们先前对任务的了解。新框架的主要组成部分，称为检测变压器或DERT，是一个基于集合的全局损失，通过二部分匹配强制独特的预测，以及变压器编码器-解码器架构。给定一组固定的学习对象查询，减少对象与全局图像上下文之间关系的原因，从而直接并行输出最终的一组预测。与许多其他现代探测器不同，新模型概念简单，不需要专门的库。DERT在挑战性COCO目标检测数据集上显示出与成熟且高度优化的更快RCNN基线相当的准确性和运行时性能。此外，DERT可以很容易地推广到以统一的方式产生全光分割。我们发现它明显优于竞争基线。培

最低0.47元/天解锁文章

Nefelibat

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
2020ECCV 论文（一）End-to-End Object Detection with Transformers

ECCV是什么ECCV的全称是European Conference on Computer Vision(欧洲计算机视觉国际会议) ，两年一次，是计算机视觉三大会议（另外两个是ICCV和CVPR）之一。每次会议在全球范围录用论文300篇左右，主要的录用论文都来自美国、欧洲等顶尖实验室及研究所，中国大陆的论文数量一般在10-20篇之间。ECCV2010的论文录取率为27%。ECCV是一个欧洲会议，欧洲人一般比较看中理论，但是从最近一次会议来看，似乎大家也开始注重应用了，oral里面的demo非常之多，演
复制链接

扫一扫