运动目标跟踪(MOT)子系统(也称为多目标检测与跟踪-DATMO)负责检测和跟踪自动驾驶汽车周围环境中运动障碍物的姿态。
该子系统对于使自主车辆做出决策和避免与潜在移动物体(如其他车辆和行人)碰撞至关重要。
随着时间的推移,移动障碍物的位置通常是根据测距传感器(如激光雷达和雷达)或立体相机捕获的数据来估计的。单目摄像机的图像能够提供丰富的视觉信息,可以用来改进运动障碍假设。针对传感器测量的不确定性,采用Bayes滤波器(如Kalman和粒子滤波器)进行状态预测。
MOT方法主要分为六类:传统的、基于模型的、基于立体视觉的、基于栅格地图的、基于传感器融合的和基于深度学习的。
MOT 方法分类
1、Traditional Based MOT
传统的MOT方法主要包括三个步骤:数据分割、数据关联和过滤。
在数据分割阶段,利用聚类或模式识别技术对传感器数据进行分割。
在数据关联步骤中,使用数据关联技术将数据段与目标(移动障碍物)关联。
在滤波阶段,对于每个目标,通过取分配给目标的数据的几何平均值来估计位置。
位置估计通常由卡尔曼滤波或粒子滤波进行更新。
2、Model Based MOT
基于模型的方法直接从传感器数据中推断,使用传感器的物理模型和对象的几何模型,并使用非参数滤波器(如粒子滤波器)。不需要数据分割和关联步骤,因为几何对象模型将数据关联到目标。
3、Stereo Vision Based MOT
基于立体视觉的方法依靠立体图像对提供的颜色和深度信息来检测和跟踪环境中的运动障碍物。
Ess等人提出了一种障碍物检测和识别方法,该方法仅使用来自前视立体摄像机的同步视频。他们的工作重点是基于行人和汽车探测器每帧输出的障碍物跟踪。
对于障碍物检测,他们采用了一种带有方向梯度直方图(HOG)特征的支持向量机(SVM)分类器,将每个图像区域分类为障碍物或非障碍物。对于障碍物跟踪,他们应用一种假设和验证策略,将一组轨迹拟合到可能检测到的障碍物上,使得这些轨迹一起具有很高的后验概率。候选轨迹集由扩展卡尔曼滤波器(EKFs)生成,EKFs由障碍物检测初始化。最后,使用模型选择技术仅保留一组解释过去和现在观测结果的最小且无冲突的轨迹。对于MOT,采用半全局匹配(SGM)方法从立体图像对中重构出稠密视差图像。三维环境中的所有障碍物都由一组称为超级像