自动驾驶--Visual-Inertial-Semantic Scene Representation for 3D object Detection (一 )

声明:

1)本文为论文阅读记录,主要用于分享和学术交流
2)若有错误,欢迎各位大牛吐槽,如有版权问题请联系:874870841@qq.com

**

这篇文章是UCLA Vision lab, University of California, 的 jingming Dong, Xiaohan Fei, 以及 Stefano Soatto 的文章,目前还是在arXiv.org.
文章链接如下 :
https://arxiv.org/pdf/1606.03968
该团队有一个类似的工作”VL-SLAM: Real-Time Visual-Inertial Navigation and Semantic Mapping” 发表在CVPR 2016 的demoPoster
相对CVPR2016 的工作,该文章给原来提出的3D bounding box 位置添加了 CAD model.

主要创新点:
通过结合IMU + SLAM + CNN 识别出场景中的物体(类别,尺寸,朝向)
1. 其中VIO 用于场景的定位以及尺度的获取,(例如避免将尺度相差很大的模型车识别成真是的车)
2. CNN (RBG 大神的YOLO)用于语义的识别, 结合几何信息进行3D object 的识别
3. 识别的物体即使被障碍物遮挡,被遮挡物体仍然存在(视频中用虚线框出)(相当于数据关联)

以下是两篇文章的效果:
第一张图为CVPR2016 demoPoster 的效果:


CVPR2016 demoPoster:

第二张图为CVPR2016 demoPoster 的效果:


这里写图片描述
两个效果都能区分出玩具车和真是车辆,不仅如此,还恢复出车辆在空间中的位姿。

以下是该文章都是相对 sub-CNN 的定量比较:


这里写图片描述

相对 sub-CNN 的定性比较:


这里写图片描述

文章和公式还在阅读和推导中,后续请继续关注!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
DM-VIO是一种基于延迟边缘化的视觉惯性里程计(Visual-Inertial Odometry)算法。视觉惯性里程计是一种通过分析相机和惯性测量单元(IMU)的数据来估计相机在三维环境中的运动的技术。DM-VIO通过边缘化传感器测量历史来实现优化过程,以提高姿态和位置估计的准确性。 传统的VIO算法通常会使用非线性优化方法来进行估计,但是由于计算能力和传感器延迟的限制,实时性和鲁棒性方面存在一定的挑战。DM-VIO通过引入延迟边缘化的方法,将传感器测量历史进行边缘化处理,从而实现了良好的实时性能。 具体来说,DM-VIO首先对传感器数据进行预处理,包括惯性测量单元的时间戳校准和相机的畸变校正。然后通过非线性优化方法估计相机的位姿和速度。在优化过程中,DM-VIO使用延迟滑窗来处理传感器延迟问题,将最近的一段时间内的测量数据一起进行优化,并通过边缘化处理来移除旧的数据。 DM-VIO算法的优势在于它能够有效地处理传感器延迟,并且在保持良好的实时性能的同时提高了估计的准确性。通过考虑传感器测量历史,DM-VIO能够更好地捕捉相机的运动特性,并减少噪声和误差的影响。 总之,DM-VIO是一种基于延迟边缘化的视觉惯性里程计算法,通过处理传感器延迟和优化历史测量数据,它能够实现更好的实时性能和准确性,对于自主导航、增强现实等应用具有重要的意义。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值