论文泛读: Salience DETR: Enhancing Detection Transformer with Hierarchical Salience Filtering Refinement

Salience DETR: Enhancing Detection Transformer with Hierarchical Salience Filtering Refinement

论文链接: https://openaccess.thecvf.com/content/CVPR2024/html/Hou_Salience_DETR_Enhancing_Detection_Transformer_with_Hierarchical_Salience_Filtering_Refinement_CVPR_2024_paper.html
代码链接: https://github.com/xiuqhou/Salience-DETR

论文中的知识补充

主要包含没有了解的论文中提到的知识(相关工作)

动机

现状

  • DETR方法在端到端方式显著提高了检测性能。它们的主流两阶段框架执行密集的自注意力并选择一部分查询用于稀疏交叉注意力,这被证明可有效提升性能,但也引入了沉重的计算负担和对稳定query选择的强依赖性。

问题

  • 由于两阶段初始化中所选query和对象之间的不匹配,次优的两阶段选择策略会导致尺度偏差和冗余。
  • 由于查询缺乏区分性,这会导致性能不佳。这些问题是由于检测Transformer中的两种类型的冗余:编码冗余和选择冗余。对背景query执行自注意力可能会引入不相关和缺乏区分性的信息,从而导致编码冗余。两阶段初始化选择的查询与实际对象并不完全一对一匹配,即选择冗余。

贡献

  • 提出了分层显著性过滤细化,它仅对经过过滤的判别行query执行Transformer,从而在计算效率和精度之间取得更好的平衡。过滤过程通过一种新颖的尺度无关显著性监督来克服尺度偏差。
  • 为了弥补query之间的寓意错位,引入了精心设计的query细化模块,以实现稳定的两阶段初始化。

方法

  • 提出了一种具有分层显著性过滤细化的新型检测器,名为Salience DETR。
  • 引入了一种显著性引导的监督,该监督与尺度无关,以克服query过滤过程中的尺度偏差。
  • 在上面的监督下,提出了一种分层query过滤机制,通过编码选定的query来减少编码冗余
  • 为了弥补query之间的语义错位,提出了三个精心设计的模块,从多尺度特征、前景-背景差异和选择策略的角度来细化查询。

Salience DETR结构图:
在这里插入图片描述

Cross-level token fusion在这里插入图片描述

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小夏refresh

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值