干货!探索单目车辆估计中的中间几何表示

本文提出Ego-Net模型,通过设计车辆局部形貌的中间几何表示,直接估计相机坐标系下车辆姿态。针对现有方法的局限性,Ego-Net回归三维框顶点和插值点,利用投影不变的先验知识,通过交叉比损失在无标注数据上进行监督学习。实验证明,Ego-Net在车辆姿态估计任务中表现出良好的性能和鲁棒性。
摘要由CSDN通过智能技术生成

点击蓝字

20d17fa50b364ab09482e83f8793dced.png

关注我们

AI TIME欢迎每一位AI爱好者的加入!

我们在这项工作中提出一种从单张RGB图片估计车辆在相机坐标系中姿态的方法。与传统方法不同的是,我们不采用先估计观测角再进行转换的二步方法,而是通过提取有几何意义的中间特征直接估计车辆姿态。如何设计这样的中间特征并有效地监督模型学习这样的特征是本文主要探索的研究问题。我们提出用一种插值立方体的表示编码车辆的朝向,并定义其在图片的投影点坐标作为中间几何特征。这样的定义只使用原始的标注从而不依赖于更富有细节的标注。这样定义中间特征同时引入了基于投影不变的先验知识。我们根据这样的先验信息提出了一项可以在无标注数据上计算的损失函数,从而可以利用无标注的数据监督中间特征的学习。本文实现的基于单目相机的系统在KITTI数据集上取得了良好的车辆姿态估计精度,甚至可以与一些双目系统相比。相关的代码和预训练模型已经在项目网站开源。

本期AI TIME PhD直播间我们有幸邀请到香港科技大学视觉与系统设计实验室的计算机系博士——李世超,为我们带来报告分享《探索单目车辆估计中的中间几何表示》

6166ceb09eaeaf4ec0438419f2b4bcf7.png

李世超:香港科技大学计算机系在读博士,师从郑光廷教授,本科毕业于浙江大学。其研究兴趣包括三维视觉和机器学习,参与过的研究课题有三维目标检测,姿态估计,基于物理的数值仿真等。其在CVPR,ECCV, T-PE,T-ED等会议和期刊发表过论文,且CVPR 2020的论文入选口头报告。

个人主页: https://nicholasli1995.github.io/

01

 背  景 

(1) 车辆姿态估计的应用场景

自动驾驶系统的感知模块,对周围车辆姿态分析有助于自动驾驶系统预测周围车辆动向。这里的车辆姿态指相机坐标系下车辆的3自由度姿态。

add0432cdcf4db6d03838492450947da.png

交通监管系统中,对于来往车流姿

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值