1. 文章和代码链接
《ImVoxelNet: Image to Voxels Projection for Monocular and Multi-View General-Purpose 3D Object Detection》
paper:
https://arxiv.org/abs/2106.01178
code:
https://github.com/saic-vul/imvoxelnet
paperwithcode:
team:莫斯科三星AI中心
2. 摘要
摘要有如下3个关键点:
1)端到端的基于单帧或者多帧(每个场景帧数可以不一样)RGB图像的3D目标检测
2)能够兼容室内和室外(主要针对自动驾驶)的场景
3)能够兼容单目相机和多目相机(自动驾驶不同传感器配置组合)的目标检测