2020ECCV 论文(一)End-to-End Object Detection with Transformers

本文介绍了ECCV会议及其在计算机视觉领域的地位,重点讨论了一篇关于使用Transformer进行端到端目标检测的论文——DETR。DETR简化了检测流程,无需非极大抑制或锚点生成,通过集合预测损失和Transformer架构实现直接预测。该模型在COCO数据集上的表现与成熟的Faster R-CNN相当,并能轻松推广到实例分割。DETR的实现代码简洁,约50行PyTorch代码即可完成推理。
摘要由CSDN通过智能技术生成

ECCV是什么

ECCV的全称是European Conference on Computer Vision(欧洲计算机视觉国际会议) ,两年一次,是计算机视觉三大会议(另外两个是ICCV和CVPR)之一。每次会议在全球范围录用论文300篇左右,主要的录用论文都来自美国、欧洲等顶尖实验室及研究所,中国大陆的论文数量一般在10-20篇之间。ECCV2010的论文录取率为27%。
ECCV是一个欧洲会议,欧洲人一般比较看中理论,但是从最近一次会议来看,似乎大家也开始注重应用了,oral里面的demo非常之多,演示效果很好,让人赏心悦目、叹为观止。不过欧洲的会有一个不好,就是他们的人通常英语口音很重,有些人甚至不太会说英文,所以开会和交流的时候,稍微有些费劲。

1 论文初读

1.1 摘要

摘要。提出了一种将目标检测视为直接集预测问题的新方法。我们的方法简化了检测管道,有效地消除了对许多手工设计的组件的需求,如非最大抑制程序或锚生成,这些组件明确地编码了我们先前对任务的了解。新框架的主要组成部分,称为检测变压器或DERT,是一个基于集合的全局损失,通过二部分匹配强制独特的预测,以及变压器编码器-解码器架构。给定一组固定的学习对象查询,减少对象与全局图像上下文之间关系的原因,从而直接并行输出最终的一组预测。与许多其他现代探测器不同,新模型概念简单,不需要专门的库。DERT在挑战性COCO目标检测数据集上显示出与成熟且高度优化的更快RCNN基线相当的准确性和运行时性能。此外,DERT可以很容易地推广到以统一的方式产生全光分割。我们发现它明显优于竞争基线。培

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Nefelibat

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值