UP-DETR

UP DETR思路:

(1)为了避免查询patch检测对分类特征的破坏,冻结了的预训练backbone,然后用patch的特征重构来维持变压器的特征识别。

(2)不同的对象查询关注不同的位置区域和方框大小。简单的单查询pre_train,并将其扩展为多查询版本。针对多查询patch,用对象查询shuffle和注意掩码解决了查询补丁和对象查询之间的分配问题。

裁剪的补丁是随机选择的,彼此独立。必须在整个解码器中保持这种独立性。即分配给一个补丁的对象查询不得与来自其他补丁的对象查询交互。

Independence of Query Patches
The cropped patches are randomly selected and are independent of each other. This independence must be preserved throughout the decoder .i.e Object Queries assigned to one patch must not interact with object queries from other patches. This can be enforced using an attention mask. This attention mask is added to the similarity of Q,K while calculating attention. Value of the mask is -infinity when Q and K belong to different image patches and 0 when they belong to the same image patch.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值