前言
MV3D-Net融合了视觉图像和激光雷达点云信息;它只用了点云的俯视图和前视图,这样既能减少计算量,又保留了主要的特征信息。随后生成3D候选区域,把特征和候选区域融合后输出最终的目标检测框。
论文地址:Multi-View 3D Object Detection Network for Autonomous Driving
开源代码:https://github.com/bostondiditeam/MV3D
目录
一、框架了解
先看下总体网络结构:(可以点击图片放大查看)
上图中的紫色圆圈中M是表示 :基于元素的均值。
输入的数据:有三种,分别是点云俯视图、点云前视图和二维RGB图像。“点云投影”,其实并非简单地把三维压成二维,而是提取了高程、密度、光强等特征,分别作为像素值,得到的二维投影图片。
输出数据&