《BoxeR: Box-Attention for 2D and 3D Transformers》讲解

最新推荐文章于 2024-09-03 22:57:13 发布

江南綿雨

最新推荐文章于 2024-09-03 22:57:13 发布

阅读量701

点赞数

分类专栏： Transformer检测系列文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43702653/article/details/126261648

版权

Transformer检测系列专栏收录该内容

9 篇文章 3 订阅

订阅专栏

文章目录

一：创新点

一：创新点

这篇论文也是效仿的Deformable transformer中改进思想，对于k的选取进行了特定选取。

Deformable transformer中提出了deformable-attention模块来选取reference_point附近的几个位置key，然后进行特征融合。

这篇论文则是提出了box-attention模块来特征融合，首先每一个query设置一个ref_windows，源码中是2✖2大小，学习调整这个框的offset，然后融合特定位置上的value，更新query。

decoder中两篇论文的思路也是一样的，都是先通过nn.MultiAttention()完成self-attention，然后通过他们提出的box-attention(deformable-attention)来交叉更新dec_query。

详细可以参考本人写的Deformable DETR源码讲解，核心思路都是一样的。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《BoxeR: Box-Attention for 2D and 3D Transformers》讲解

《BoxeR: Box-Attention for 2D and 3D Transformers》讲解
复制链接

扫一扫

专栏目录

江南綿雨 CSDN认证博客专家 CSDN认证企业博客

码龄6年

80: 原创

3470: 周排名

206万+: 总排名

49万+: 访问

: 等级

2240: 积分

2万+: 粉丝

1118: 获赞

246: 评论

4756: 收藏

私信

关注

热门文章

分类专栏

最新评论

Deformable DETR源码解读
modan_moon: “根据Linear生成的attention_weights进行特征融合（注意注意力权重不是Q*k算来的，而是对query直接Linear得到的”这个设定是不是允许q,k,v输入可以是不同形状？那么，其他利用Q*K计算的注意力机制是不是不可以替代它呢？
Jetson Orin环境安装Opencv+Cuda以及vscode环境配置
江南綿雨: 不好意思哈，现在放开了
单目深度估计--深度学习篇
zzRh_5479: 很难，你需要有专门的深度摄像头去采集数据
单目深度估计--深度学习篇
agrichron: 大佬，如果自己制作这种数据集该怎么操作呀？
单目深度估计--深度学习篇
agrichron: 有什么比较推荐的单目深度估计算法推荐吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。