bev 之 fastBEV

最新推荐文章于 2024-08-05 23:28:05 发布

maxruan

最新推荐文章于 2024-08-05 23:28:05 发布

阅读量306

点赞数 4

文章标签：计算机视觉人工智能目标跟踪自动驾驶视觉检测图像处理

本文链接：https://blog.csdn.net/long630576366/article/details/140334768

版权

在这里插入图片描述
前面我们提到bev 之 LSS, 知道视觉的BEV方案的主要痛点在于:
1、depth 的预测
2、图像特征到BEV特征之间的视图变换消耗大量计算

LSS 为什么需要D维深度

占据大量消耗的原因是LSS 对每个图像特征点引入深度D，即假设每个像素上存在可能的D维深度。也就是假设不同像素深度上对应的图像特征不同。

能不能去除深度特征

从M2BEV中，假设图像到BEV视图的转换过程沿相机光线的深度均匀分布，也就是说不同深度对应的图像特征是相同的。基于这个理论，就可以将深度D去掉。
在这里插入图片描述
LSS 基于像素深度上的特征均匀分布，这比LSS 看起来非常暴力，去掉深度维度确实可以大幅度提高速度。

分析原因：Lss想做的是对于射线空间中无占据的区域希望其特征为0，只保留有物体的语义特征的精准预测，这就依赖深度预测。而fastbev 则假设射线经过的空间均有可能存在语义特征，且相同。然后用3d neck进一步融合粗采样的bev特征。所以对图像上的同一个物体，映射到BEV上后其特征也能像带有深度预测一样聚集一块，只是会有部分局部特征会分散到bev空间其他位置，这部分分散的特征在BEV空间是冗余的，但是不影响聚集特征的预测。所以3d neck本身是不可或缺的，否则精度将明显掉点。