o 点击我爱计算机视觉标星,更快获取CVML新技术
基于单目图像的3D目标检测是在输入RGB图像的情况下估计目标的3D包围框,在自动驾驶领域非常有用。
今天来自中科院沈阳自动化所等单位的学者公布论文提出一种实时的单目3D目标检测算法RTM3D,快速版30fps,并且代码将开源。
以下是作者信息:
RTM3D算法的主要思路,如图:
输入RGB图像,经过深度神经网络,预测目标的9个空间点(1个中心点,8个顶点),使用几何限制估计更加精确的9个空间点,进而找到目标的3D包围框。
下表为该文算法与其他3D目标检测方法比较,RTM3D不需要其他外部数据,而且速度达到