1. 文章和代码链接
《ImVoxelNet: Image to Voxels Projection for Monocular and Multi-View General-Purpose 3D Object Detection》
paper:
https://arxiv.org/abs/2106.01178
code:
https://github.com/saic-vul/imvoxelnet
paperwithcode:
team:莫斯科三星AI中心
2. 摘要

摘要有如下3个关键点:
1)端到端的基于单帧或者多帧(每个场景帧数可以不一样)RGB图像的3D目标检测
2)能够兼容室内和室外(主要针对自动驾驶)的场景
3)能够兼容单目相机和多目相机(自动驾驶不同传感器配置组合)的目标检测
3. 模型结构

本文介绍了ImVoxelNet,一种端到端的3D目标检测算法,能在单帧或多帧RGB图像中进行通用目标检测,适用于室内和室外自动驾驶场景,兼容单目和多目相机。该模型通过将RGB图像投影到3D空间实现高效目标检测。莫斯科三星AI中心的成果,论文链接附带代码资源。

被折叠的 条评论
为什么被折叠?



