基于深度神经网络规划的步行预测
摘要
准确的交通参与者预测是自主车辆避碰的前提。在这项工作中,我们通过模拟行人自己的运动规划来预测行人。根据在线观察,我们推断出可能目的地的混合密度函数。我们将此结果用作基于常见行为模式执行运动预测的规划阶段的目标状态。整个系统被建模为一个单片神经网络,并通过反向强化学习进行训练。对真实世界数据的实验验证表明,该系统能够准确预测目的地和轨迹。
介绍
随着人工智能的最新进展,全自动驾驶的目标似乎已经触手可及。然而,为了安全操纵这种车辆,必须防止碰撞。对于它自己的运动规划,自动车辆必须预测其他交通参与者的行为。这对于易受伤害的道路使用者尤其重要,因为碰撞可能是致命的。因此,准确预测人体运动是必要的。
虚拟现实单元的预测通常被实现为观察到的动态的外推,例如通过递归贝叶斯滤波。详细研究见[1,2]。然而,对于更大的前瞻时间,由于人类运动的高度动态性,有意义的预测变得不可行。
为了解决这个问题,已经提出了基于分类的预测。这些方法处理离散的问题,例如“行人会过马路吗?”[3].它们基于两个至关重要的预测假设:首先,行人行为是由意图驱动的,其次,这种意图可以从更多的线索中推断出来,而不仅仅是纯粹的动力学。
如果我们专门针对一个人的意图,预测可以被建模为一个目标导向的计划任务。在这里,意图对应于一个空间目的地。齐巴特、基塔尼等人的工作提出了马尔可夫决策过程和反向强化学习来解决预测问题[4,5]。虽然这些工作可以长时间预测行人,但它们需要静态观察和预先定位可能的目的地。对动态道路场景的适应是存在的,但是它们仍然使用相对幼稚的场景模型和目的地模型[6,7]。
然而,这一意图可以从观察中准确推断出来。例如,人类很少依靠视觉线索来预测活动[8]。到路缘的距离或头部方向等特征已经成功地用于交通中的意图识别[3,9]。然而,这些工作忽略了意图推理对基于计划的预测的影响。
在这项工作中,我们提出在单个人工神经网络中解决意图识别和基于规划的预测问题。目的地形式的意图是使用递归混合密度网络预测的。然后,我们将这些目的地的规划问题公式化为卷积神经网络。我们提出了两种不同的规划架构,即MDP网络和前向后向网络。作为这些规划算法基础的拓扑是由一个全卷积网络(FCN)生成的,它在环境地图上运行。通过互连所有单个网络,有可能在单片反向强化学习设置中联合训练整个设置。