CFT:Multi-Camera Calibration Free BEV Representation for 3D Object Detection——论文笔记

参考代码:暂无

1. 概述

介绍:在相机数据作为输入的BEV感知算法中很多是需要显式或是隐式使用相机内外参数的,但是相机的参数自标定之后并不是一直保持不变的,这就对依赖相机标定参数的算法带来了麻烦。如何提升模型对相机参数鲁棒性,甚至是如何去掉相机参数成为一种趋势。对应的这篇文章完全去除了相机参数依赖,首先通过PA(position-aware enhancement)实现强大BEV空间位置编码,之后BEV空间位置编码与图像特征做cross attention实现BEV特征提取,这里的cross attention是针对特定区域的VA(view-aware attention),这个区域是通过相机空间布置位置作为先验进行划分的。这样通过上述的两个模块构建了一个高效的BEV空间特征提取网络,并且在内存占用和计算效率上有了较大提升。

对于相机参数的使用可以划分为如下几种使用方法:
在这里插入图片描述

  • 1)显式使用:通过内外参数建立3D空间和2D空间中的对应关系,并以此对应关系进行特征索引或提取,带来的好处是直观并且收敛速度快,但对相机参数很敏感。
  • 2)隐式使用:将内外参数隐式编码(embedding)并通过query的形式获取最后的特征表达,好处是对相机参数相对鲁棒。但是做query的维度不能太大(CVT的querysize为25),否则计算量和内存扛不住,太小也导致性能会被削减厉害。
  • 3)完全不使用:这类方法中完全抛弃了相机参数,通过构建attention机制实现BEV特征和图像特征的关联,从而得到BEV表达。但是这需要强大的position/content表达和cross attention算力,实际训练和部署中也会存在对应的问题。但是文章通过提出的PA和view-aware attention给出了一个可行方案。

按照以上三种相机使用方法进行划分,文中对现有的一些方法进行划分:
在这里插入图片描述
将文章的方法和其它一些方法对比相机参数鲁棒性:
在这里插入图片描述
一条近乎直线的变化,稳得一批。

2. 方法设计

2.1 网络pipeline

文章的网络pipeline见下图所示:
在这里插入图片描述
在上图中可以看到文章提出的两点改进PA和VA。其中PA是对位置编码进行强化,其使用了BEV 2D和content编码,并通过PA网络实现特征增强。

2.2 Position-aware Attention

PA的网络结构见下图所示:
在这里插入图片描述
对于BEV的2D query表示为 Q p ∈ R H b ∗ W b ∗ C p Q_p\in R^{H_b*W_b*C_p} QpRHbWbCp,这个2Dquery会经过FFN网络和sigmoid激活之后用于表示BEV的高度信息
z r e f = N o r m ( S i g m o i d ( F F N ( Q r e f ) ) ) z_{ref}=Norm(Sigmoid(FFN(Q_{ref}))) zref=Norm(Sigmoid(FFN(Qref)))
自然这个高度信息也是可以添加实际监督约束(如L1 loss)的,不过文中后续实验表明显式添加约束可不需要。之后再经过正弦函数编码与BEV 2D query做融合:
Q e p = a d d ( M ⋅ Q r e f , Q p ) , M = F F N ( Q c ) , Q r e f = S i n u o i d a l ( z r e f ) Q_{ep}=add(M\cdot Q_{ref},Q_p),M=FFN(Q_c),Q_{ref}=Sinuoidal(z_{ref}) Qep=add(

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
IBM WinPE CFT-V1.6是IBM服务器PE工具的一个版本。PE是“Preinstallation Environment”的缩写,是一种预安装环境,用于在计算机硬盘上安装新的操作系统或修复现有操作系统时使用。IBM WinPE CFT-V1.6是为IBM服务器定制的PE工具,旨在提供一套功能强大的工具和驱动程序,以方便和简化服务器操作系统的安装和维护。 IBM WinPE CFT-V1.6具有许多功能。首先,它提供了一套完整的驱动程序,用于兼容不同型号的IBM服务器。这确保了在安装和维护过程中的兼容性和可靠性。其次,它包含一些实用工具,如磁盘分区和格式化工具、数据备份和还原工具等,以帮助管理员进行服务器配置和维护。另外,它还集成了一些常用的诊断工具,以帮助发现和解决服务器硬件或软件方面的问题。 使用IBM WinPE CFT-V1.6工具,管理员可以轻松地执行各种操作,如安装操作系统、上传和安装最新的驱动程序、配置网络和存储设置等。它提供了一个用户友好的界面,使得操作变得更加简单和高效。同时,它还支持自动化脚本和批处理命令,以便管理员可以根据具体需求进行自动化操作。 总之,IBM WinPE CFT-V1.6是一款功能强大的IBM服务器PE工具,旨在简化和改进服务器操作系统的安装和维护过程。它提供了全面的驱动程序、实用工具和诊断工具,以满足管理员的各种需求。通过使用IBM WinPE CFT-V1.6,管理员可以更轻松地管理IBM服务器,提高工作效率。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值