Anchor DETR: Query Design for Transformer-Based Detector
(2021.9)
1.DETR的object query是学习的,没有物理意义也不能解释每个query注意哪。作者认为学习出来的object query不能关注特定的区域。本文提出来,object query的是基于anchor point的,这种设计下,每个object query只关注anchor点周围的目标,另外,每个object query可以在一个位置上预测多个目标(多模式)。
2.设计了一种注意力变体,可以减少内存成本。
Introduction
本文基于DETR做改进,肯定得先说一下DETR的优点就是一个可学习的object query集合来推理目标物和全局图像的关系。然后转折,说DETR局限了,也就是学习到的object query难以解释,也不能关注特定位置。