点击蓝字
关注我们
AI TIME欢迎每一位AI爱好者的加入!
我们在这项工作中提出一种从单张RGB图片估计车辆在相机坐标系中姿态的方法。与传统方法不同的是,我们不采用先估计观测角再进行转换的二步方法,而是通过提取有几何意义的中间特征直接估计车辆姿态。如何设计这样的中间特征并有效地监督模型学习这样的特征是本文主要探索的研究问题。我们提出用一种插值立方体的表示编码车辆的朝向,并定义其在图片的投影点坐标作为中间几何特征。这样的定义只使用原始的标注从而不依赖于更富有细节的标注。这样定义中间特征同时引入了基于投影不变的先验知识。我们根据这样的先验信息提出了一项可以在无标注数据上计算的损失函数,从而可以利用无标注的数据监督中间特征的学习。本文实现的基于单目相机的系统在KITTI数据集上取得了良好的车辆姿态估计精度,甚至可以与一些双目系统相比。相关的代码和预训练模型已经在项目网站开源。
本期AI TIME PhD直播间我们有幸邀请到香港科技大学视觉与系统设计实验室的计算机系博士——李世超,为我们带来报告分享《探索单目车辆估计中的中间几何表示》
李世超:香港科技大学计算机系在读博士,师从郑光廷教授,本科毕业于浙江大学。其研究兴趣包括三维视觉和机器学习,参与过的研究课题有三维目标检测,姿态估计,基于物理的数值仿真等。其在CVPR,ECCV, T-PE,T-ED等会议和期刊发表过论文,且CVPR 2020的论文入选口头报告。
个人主页: https://nicholasli1995.github.io/
01
背 景
(1) 车辆姿态估计的应用场景
自动驾驶系统的感知模块,对周围车辆姿态分析有助于自动驾驶系统预测周围车辆动向。这里的车辆姿态指相机坐标系下车辆的3自由度姿态。
交通监管系统中,对于来往车流姿