3D Object Detection——BEV-based methods

最新推荐文章于 2024-07-18 08:54:07 发布

考拉喜欢吃火腿

最新推荐文章于 2024-07-18 08:54:07 发布

阅读量1.4k

点赞数

分类专栏： 3D点云处理

本文链接：https://blog.csdn.net/qq_24505417/article/details/108784909

版权

18 篇文章 14 订阅

订阅专栏

MV3D：Multi-View 3D Object Detection Network for Autonomous Driving

代表1：MV3D

雷达点云与单目视觉融合提取3D bounding-box。

将雷达获取的3D点云投影到前视图和鸟瞰图；
在鸟瞰图上通过卷积网络提取特征，回归出初始的包含前景的3D proposal，类似RPN；
将粗糙的3D proposal投影到前视图和RGB图像，因为特征从不同的视角/模态通常有不同的分辨率，作者采用ROI pooling 为每一个模态获得相同长度的特征向量；
在鸟瞰图上也crop出特征，并将三种特征融合。融合方式采用深度融合方式；
用融合后的特征再次进行分类和回归。

输入数据：

深度融合：

代表2：AVOD （进阶版的MV3D)

激光+单目相机

输入为RGB图像和BEV（Bird Eye View），利用FPN网络得到二者全分辨率的特征图，再通过Crop和Resize提取两个特征图对应区域的特征，并进行融合，对挑选出的top k 个3D proposal进行3D物体检测。

相比MV3D，改进有：

关注

专栏目录