【自动驾驶】视觉里程计

无人驾驶中的视觉里程计概念解读

里程计的概念:

在里程计问题中,我们希望测量一个运动物体的轨迹。这可以通过许多不同的手段来实现。例如,我们在汽车轮胎上安装计数码盘,就可以得到轮胎转动的距离,从而得到汽车的估计。或者,也可以测量汽车的速度加速度,通过时间积分来计算它的位移。完成这种运动估计的装置(包括硬件和算法)叫做里程计(Odometry)

里程计的特性:

里程计一个很重要的特性,是它只关心局部时间上的运动,多数时候是指两个时刻间的运动。当我们以某种间隔对时间进行采样时,就可估计运动物体在各时间间隔之内的运动。由于这个估计受噪声影响,先前时刻的估计误差,会累加到后面时间的运动之上,这种现象称为漂移(Drift)

视觉里程计的概念:

视觉里程计VO的目标是根据拍摄的图像估计相机的运动。它的主要方式分为特征点法直接方法。其中,特征点方法目前占据主流,能够在噪声较大、相机运动较快时工作,但地图则是稀疏特征点;直接方法不需要提特征,能够建立稠密地图,但存在着计算量大、鲁棒性不好的缺陷。

视觉里程计的基本原理:

视觉里程计利用车载摄像机采集到的图像信息恢复车体本身的六自由度运动,包括三自由度的旋转和三自由度的平移。由于类似于里程计的航迹推算.这种基于图像信息的自运动估计方法被称为视觉里程计技术。视觉里程计的基本步骤包括特征提取、特征匹配、坐标变换和运动估计。当前大多数视觉里程计系统仍是基于此框架。与视觉里程计技术联系非常紧密的两个研究领域是形状信息运动复原(StructurefromMotion,SFM)算法SLAM算法。在视觉SLAM问题中,需要同步实时估计摄像机本身的位置以及所检测的路标的空间位置及其关联,从而对其所处的环境进行地图创建。早期的SLAM算法需要依靠那些能够获得深度信息的传感器,如激光雷达、声呐等;而近年来单纯依靠机器视觉的V-SLAM开始得到关注,如单目视觉SLAM算法。其计算机制在本质上与基于非线性滤波器的视觉里程计系统非常相似。

SFM算法,也就是从二维图像数据中恢复三维场景结构以及摄像机本身的六自由度运动的方法。在这里,摄像机提供的观测量都是特征位置在摄像机坐标系下的二维投影。在经典的视觉SLAM的术语中,可以说SFM的设备只提供了方位而没有范围。对于两帧视觉里程计,有研究者将其称为基于SFM技术的视觉里程计,可以视为不需要估计场景结构的SFM算法,或者简化了的SFM算法。所以,此类视觉里程计算法的核心模块大多来自经典SFM算法。

纯视觉系统与混合系统:

根据前文定义,仅仅依靠视觉信息输入的里程计系统被称为纯视觉系统。这里提到的绝大部分算法都属于纯视觉系统,但是对于增量式的两帧视觉里程汁的累积误差,除了光束法平差,也可以采用能提供全局定位信息的全球定位系统(GPS),或能够提供短期精度高的高频数据的惯性导航元件(IMU)等来改进系统性能。这种依靠其他传感器来辅助视觉进行定位导航的系统被称为混合系统。它们大都是基于非线性滤波器,如EKF,UKF等的数据融合机制。其中,又以摄像机-IMU的融合系统应用最为广泛。然而引人附加传感器的做法可能会带来新的问题,如多传感器间位置关系的精确标定,正确的数据融合等,仍需要进一步研究。

视觉里程对计算机视觉的应用,能够对无人驾驶车进行自主定位,车载视觉里程计也可以用作检测前方目标,对车的行驶方向进行决策

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
DeepVO是一种基于人工智能的视觉里程计模型,它能够根据图像序列准确地估计相机的运动轨迹。视觉里程计是指通过计算相邻图像之间的相对位移,从而推测出相机或者车辆的运动轨迹。传统的视觉里程计方法通常需要进行特征提取、匹配和三角化等步骤,而DeepVO则使用了深度学习算法,可以直接从图像中直接学习运动模式,无需显式地提取特征。DeepVO主要由两个模块组成:视觉前端和运动估计网络。 首先,视觉前端处理图像数据,它将输入的连续图像序列转换成特征序列,这些特征可以在后续的运动估计网络中使用。视觉前端采用了卷积神经网络(CNN)结构,通过多个卷积和池化层提取图像的空间特征。这些特征具有很强的判别性,有助于准确估计相机的运动。 然后,在运动估计网络中,利用长短期记忆网络(LSTM)进行运动估计。LSTM可以有效地捕捉图像序列的时序信息,有助于提高视觉里程计的准确性。运动估计网络的输入是经过视觉前端处理的图像特征序列,通过多层LSTM网络进行运动估计,并输出相机的位置和姿态。 DeepVO的训练使用了监督学习的方法,通过将真实的相机轨迹作为标签数据来训练网络模型。在训练过程中,DeepVO通过最小化真实轨迹和预测轨迹之间的差异来优化网络参数。经过大量的训练,DeepVO可以准确地估计相机的运动,并在实际应用中具有较好的性能。 总之,DeepVO是一种利用深度学习算法进行视觉里程计的方法。它通过视觉前端和运动估计网络结合,能够有效地从图像序列中学习相机的运动模式,具有较高的精度和鲁棒性。它在自动驾驶、机器人导航等领域具有广泛的应用前景。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值