【Paper Reading-3D Detection】Fully Convolutional One-Stage 3D Object Detection on LiDAR Range Images

最新推荐文章于 2024-05-22 18:16:22 发布

烤粽子

最新推荐文章于 2024-05-22 18:16:22 发布

阅读量727

点赞数

分类专栏： 3D Detection Paper Reading 文章标签： 3d 目标检测深度学习 paper reading

本文链接：https://blog.csdn.net/Mao_Jonah/article/details/125262371

版权

3D Detection 同时被 2 个专栏收录

9 篇文章 1 订阅

订阅专栏

Paper Reading

2 篇文章 0 订阅

订阅专栏

URL

https://arxiv.org/pdf/2205.13764.pdf

TL;DR

FCOS-LiDAR: Fully Convolutional One-Stage 3D Object Detection on LiDAR Range Images
本文主要提出了lidar-based 的Range View视角下的3D目标检测方法。
主要亮点：

range view, 只使用标准卷积；
在range view，使用了多帧，并且优化方法能有一个比较好的效果；
Modality-wise Convolutions：通道重新排列；
检测头不共享权重；

Dataset/Algorithm/Model/Experiment Detail

网络主体跟模仿FCOS,(其实跟FCOS3D差不多)，很多工作在前处理部分，在怎么得到range view image上。
笛卡尔坐标系投影到球坐标系跟其他做法差别不大。
Multi-round Range View Projection
作者发现多帧稠密化之后，range view下有很多的点碰撞，到最后有90%的点被丢弃，导致稠密化之后抽帧效果跟单帧差别不大。作者采用多次（5次效果最好）投影的方式，得到新的 range view image;

Modality-wise Convolutions
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HPgjx4Pg-1655108238567)(upload://tkyTfmlAkhefI0SrhpSYzT3M1SF.png)]

主要思路是把 [x,y,z] , [r,θ,φ] , [i] , [e] and [t] 这几个类型的通道按相同类型的放一起；实验结果如下：mAP涨点0.6~0.7，NDS涨点不多；
在这里插入图片描述

Untied Weights of Detection Heads
这里有一点比较有趣检测头不共享权重，image-based方法共享权重效果比较好；
在这里插入图片描述

整体网络：
在这里插入图片描述

大致跟FCOS3D挺像，backbone有不少修改比如: VR分辨率低减少下采样，使用空洞卷积，ResNet-50 four stages数量更改 (3,4,6,3) --> (4,4,1,1)等。

Experiment

在这里插入图片描述

Nuscenes test上效果比centerpoint好
在这里插入图片描述

Thoughts

在bev-based方法火热的情况下，出现了一篇range view的方法并且效果还不错，近期range view的工作确实比较少，上次比较有印象的还是RangeDet。
这篇文章的一个目的也是为了避免使用3D卷积，3D稀疏卷积。还把multi frame用上了并且用好了，感觉这一块还能深挖一下。
然后检测头不共享权重似乎也可以深挖一下。