这篇文章是我在阅读论文时写的,用来整理思路,并不是为了让读者轻松读懂。作为论文的笔记,这里忽略了背景介绍和相关研究等,直接关注这种方法的实现方案,或者说,关注如何复现此研究结果。
目录:
1、作者做了啥
2、结果怎么样
3、具体来说,作者是如何实现这个结果的
1、作者做了啥
作者研究了占用预测任务的四个部分,发现占用预测头有加速潜力,于是“将3D卷积块简化为2D鸟瞰图(BEV)卷积网络,并使用插值的 Voxel 特征完善BEV特征,从而加速了3D占有率预测过程。” ——标题已经做了概括。
2、结果怎么样
达到的准确性--速度平衡如下图:
可视化结果如下图,左侧为Ground Truth,右侧ours方法明显好于中间被对比的surroundOCC方法:
3、方法:
方法的架构图如下:
方法架构分为三步:提取图像特征金字塔,视图特征通过LSS转换到3D空间再压扁为BEV特征,用BEV特征和图像特征插值得到占用网格。我们只关注第三步,这是这篇论文的主要创新点。
作者将BEV特征图重复叠加多层,得到一个不准确的占用网格,每层中的特征再映射到六个相机视图中,用双线性插值进行上采样,映射回3D占用网格,去确认并剔除无效的占用网格特征,得到准确的占用网格。