《《《翻译》》》轮式机器人导航行程时间预测

原文名称:Predicting Travel Time from Path Characteristics for Wheeled Robot Navigation

原文下载:https://www.hrl.uni-bonn.de/papers/regier17ecmr.pdf
                 https://www.hrl.uni-bonn.de/HRL/publications            

摘要

现代的移动机器人导航方法通常采用两层系统,其中首先在可能充满障碍物的环境中计算几何路径,然后使用具有避障能力的反应式运动控制器来沿着该路径到达目标。然而,当存在多路径候选时,最短路径并不总是最佳选择,因为它可能导致通过狭窄的间隙,并且由于缺乏平滑性,通常很难遵循。估计完工时间的评估是更强的选择标准,但是由于在路径计算阶段缺乏动力学模型,所以通常先验未知完工时间。我们介绍了一种基于简单易用的特征(例如路径的长度、平滑度和间隙)来估计路径完成时间的新方法。为此,我们应用非线性回归,并用基于众所周知的动态窗口方法的控制器来训练具有从实际路径执行仿真中获得的数据的估计器。如我们在实验中所表明的,我们的方法能够使用学习预测器来真实地估计2D网格路径的完成时间,并且大大优于仅基于路径长度的预测。

简介

移动机器人的基本能力是环境中的无碰撞导航。许多最先进的导航系统采用两阶段的方法以有效的方式实现这一点。这里,第一阶段致力于规划从机器人的位置到目标位置的穿过环境的空间全局路径。这样的全局路径规划通常使用基于网格的A*规划器[1 ]进行。为了随后顺畅地跟随全局计算的2D路径,通常采用局部反应式避碰系统,该系统有效地为机器人生成速度命令[2]、[3]、[4]。现在的机器人正面临着越来越复杂的任务的挑战。在一些实际应用中,这些任务的完成时间的可预测性起着重要的作用。特别是在需要精确地协调多个机器人的动作的多机器人场景中,任务完成时间的预测对于节省时间的规划是至关重要的。这样的场景包括协作的地板清洁和家庭任务、需要估计行驶时间以便更有效的电源管理的长期自主驾驶系统[5]和博物馆导游机器人,它们必须精确地安排导游,以保证出行。观众的娱乐活动〔6〕。

移动机器人的大多数应用,比如导航,涉及环境中的运动阶段时,行程时间可以占整个任务完成时间的很大一部分。然而,最快的选项通常不同于使用成本网格地图上的2D路径规划找到的最短或成本最小的解决方案。考虑例如图1,其中机器人具有两个到达目标位置的选项。第一个选项(红色路径)包含有几个杂乱物体的狭窄通道。第二个选项(绿色路径)只穿过自由空间。走红色的路径,机器人需要缓慢行驶,因为它需要精确的传感和精确的运动执行,以避免碰撞。在非常紧的地方,机器人甚至不得不频繁地停下来旋转,以便调整它的方向。相反,绿色路径通过自由空间引导,机器人可以以更高的速度驱动。因此,机器人面临着如何选择最快到达目标位置的问题。对于两阶段导航系统,其中全局路径规划器与局部运动控制器结合,运动执行的精确结果通常很难或不可能提前预测,尤其是在穿越狭窄或杂乱的通道时。诸如流行的动态窗口方法(DWA)〔4〕的反应式机器人控制系统既不能保证时间最优轨迹,也不能保证系统的稳定性,也不能保证系统的收敛性。此外,许多噪声源随机地影响导航性能,即,车轮的滑动,传感器测量中的噪声,以及定位中的不准确。基于网格的环境表示的分辨率或导航成本函数的选择也可以显著地影响性能。
在本文中,我们提出了一种新的方法来预测移动时间的移动机器人的路径特征,可提前执行时间。这将允许机器人评估不同的选项,并选择被预测为最有时间效率的路径。在给定环境的网格表示中的2D路径的情况下,我们的方法基于一般路径特性(如长度、间隙和曲率)通过回归分析来预测完成时间。我们广泛地评估我们的方法在不同的环境中的不同的复杂性。

相关工作

基于网格的规划器通常计算到目标位置的空间全局路径时非常快,并且广泛用于轮式机器人的导航系统[8]、[9]、[10]。典型地,这些系统采用局部反应性避碰方法生成用于机器人遵循全局计算的2D路径的实际速度命令,例如DWA[3]、[4]或接近图方法[2]。注意,全局路径通常在障碍物附近包含尖锐的角落,使得这些低级反应系统明确地考虑偏离全局2D网格路径的偏差,以实现平滑的轨迹,与停止相比,朝着目标位置更快地前进。转过身来。Stachniss和Burgard开发了一种不同的技术,他们建议用A*[11]直接在围绕全局2D路径的局部通道的5D空间中进行规划。该空间还包含取向以及离散的平移和旋转速度。以这种方式,获得了直接考虑动-动约束的光滑轨迹。
上述所有方法都假定时间最优轨迹接近计算的2D路径,这种情况经常发生,但在存在许多障碍物时可能不是这样。在这种情况下,事实上,最好考虑不同的路径,减少需要通过的障碍。因此,我们提出了一种基于路径特性来学习机器人沿给定2D路径导航所需的时间的方法。基于2D路径的一般特征,机器人可以估计沿着路径到达目标位置所需的完成时间,并在不同的可能性中选择最佳选项。
Murphy和Newman考虑了在大型室外环境中操作的机器人,并且开发了一种方法来权衡规划具有次优长度的路径用于规划时间的风险,并在概率成本图上进行规划[8]。为了创建这样的概率成本图,通常需要关于地形的先验知识,例如环境的俯瞰图像。墨菲和纽曼的工作重点是穿越特殊类型的地形,而我们的方法是优化的,以处理具有挑战性的室内环境,主要是平坦的地板,其中地形特性发挥了次要的作用,性能。朱和Qingbao提出了一种基于遗传算法的路径规划方法〔12〕。作者介绍了描述路径特性的函数,它允许从给定的集合中选择优化的路径。这种方法不考虑机器人的运动控制系统。菲利普森[13]使用概率导航函数来权衡与动态障碍物碰撞的风险和绕道长度,以避免这些风险。然而,该方法需要调整和用户定义试探,并且不涉及经过训练的模型。
刘等人。〔7〕提出了一种基于五次Bezier样条函数的稀疏路径点到目标的时间最优控制方法。从给定的直线路径出发,考虑系统的约束条件,对轨迹进行平滑和时间优化。本文考虑不同复杂度环境下的通用导航,其中也包含高度杂乱和狭窄的通道。我们的目标是基于描述路径特性的简单、容易获得的特征来估计旅行时间,并且以这种方式使得机器人能够选择最佳选项,即,假定使用生成速度逗号的标准基于DWA的控制器以最快的速度到达目标的路径。DS以一种有效的方式。
最近,Realter等人。提出基于已经探测到的物体估计观测区域之外的障碍物密度并预测相应的穿越成本[14]。因此,假设机器人只知道周围障碍物的部分知识。本文的工作可以与这种预测步骤相结合,以便每当有关障碍物的新信息变得可用时重新计算最佳路径。

导航框架

在本文中,我们假设给出了环境的2D网格地图表示,并考虑采用经典的两阶段导航方法的移动机器人控制系统,其中全局路径由网格规划器在成本图上计算。然后,反应式局部控制器的任务是找到速度命令,允许机器人以无碰撞的运动跟随这个全局路径。一种众所周知的方法是使用DWA〔3〕、〔4〕中的推出或先行方法。DWA控制器在每个时间步骤只考虑局部成本图,这是允许系统实时操作的环境模型的一小部分。
DWA方法的基本原理如下:在每一步中,全局2D路径上的局部目标就在局部成本图之外确定。在第二步骤中,计算来自机器人控制空间的一组可行的转向命令以达到本地目标。对于每个采样速度命令,通过预定的成本函数确定和评估模拟轨迹。在评估的基础上,采用最优轨迹的速度进行控制。用于评估轨迹的成本函数的术语基于到全局路径的距离、到局部目标的距离以及由成本图给出的遍历成本。
这样的两层方法即使在障碍物环境中也能产生健壮的无碰撞运动。然而,DWA控制器的高度不可预测性以及噪声感知和定位的影响使得运动任务的完成时间的估计成为一项困难的工作。成本图中最便宜的路线并不总是最好的选择,因为它可能穿过狭窄或杂乱的通道,如果不在现场减速和旋转,通常很难遵循。
为了说明这一点,我们在一个大的杂乱环境中进行了两个导航实验,其中机器人可以选择驾驶通过或绕过杂乱区域。图2示出了具有两个路径和它们相应的速度分布的情况。图2中的红色轮廓显示,在杂乱的区域行驶可以让机器人全速导航,并在较短的时间内达到目标,即使总的路径长度较长。然而,在密集杂波中行驶,由于更频繁的旋转、重复的速度下降以避免碰撞和现场旋转,导致更高的定位误差,而这些在导航空间非常小的区域是必需的
因此,在许多情况下,估计的完成时间是比路径成本强得多的选择准则,但是由于在路径计算阶段缺乏动态模型,完成时间通常事先未知。下面,我们介绍一种新的方法来估计完成时间从路径特征,使机器人能够选择最有希望的路径,在不同的可能的路径通过环境。

基于路径特性的出行时间预测

原则上,预测完成时间的唯一方法是模拟路径执行并测量机器人导航到目标所需的时间。我们的想法是应用机器学习方法,并训练基于少量通用特征的执行时间预测函数,这些通用特征可以从给定的全局2D网格路径有效地计算。

A.描述路径特性的特征

如图3中的示例路径所示,我们定义了机器人的当前位置与目标位置之间的路径P= {P0,P2,…,Pn},作为二维坐标(节点)PI=(Xi,Yi),i 属于{ 0…n}的序列。路径的分段Si然后由矢量Si + 1=p i+1-p i给出。我们发现路径的长度、其间隙和平滑度是表达特征,可以用来有效地估计机器人沿着路径向目标位置移动所需的时间。这些特征将在下面详细描述:

1)路径的总长度由每个路径段的长度之和给出:


2)路径的平均平滑度表示其偏离直线:


其中,θ是机器人的初始航向与第一路径段之间的角度,αj,j+1表示两个路径段sj和sj+1之间的角度。例如,图3中的α1,2表示S1和S2之间的夹角。
3)最后,平均路径间隙计算如下:


使用每个路径段si与被占细胞之间的最短距离Dmin(si,cocc)接近阈值Dmax>0。我们假设距离大于DMAX的障碍对任务执行没有影响。间隙在图3中示为从路径段SI到其最近障碍物的虚线。

B.行驶时间预测
使用上面定义的三个路径特征,我们训练预测函数。


基于路径的总长度、平均平滑度和平均间隙来估计预期路径执行时间Tp。在实际路径执行由本地控制器启动之前,这些特征是容易获得的。

C.回归模型
回归是统计分析中发现变量之间关系的常用工具。回归分析的目的是找到一个模型,它很好地拟合给定的数据点,用于以后的预测。不同的模型可以映射变量之间的不同类型的关系。线性回归,例如,是一个非常快的算法,但只能模拟线性相干性。线性回归的一个特殊情况是用简单回归线拟合数据的简单线性回归。相反,线性回归模型化几个自变量之间的关系,以预测所要求的依赖量。对于具有非线性行为的系统,线性预测往往是不够的。用更先进的方法可以获得更好的结果。例如,支持向量机是使用核函数将数据输入映射到高维特征空间的核方法。这个内核技巧允许检测数据集合中的非线性相干性。
为了找到问题的正确回归方法,我们基于上述路径特征长度、平滑度和间隙,评估用于完成时间预测的任务的简单线性回归、线性回归和支持向量方法。

实验

在这一部分中,我们讨论了数据收集过程回归分析,以及在不同环境下的预测结果
A. 数据获取
我们的目标是获得一个覆盖尽可能多的场景的单一回归模型。为了收集在特征空间上分布良好的数据,我们在各种地图上进行了实验,例如Willow办公环境和人工创建的地图(参见图4)。我们使用的一种人工地图是高度杂乱的地图,由均匀分布或高斯分布的柱子组成,其中柱子以每百平方米75根柱子、每百平方米50根柱子和每百平方米25根柱子的不同数量随机生成。根据所使用的分布,半径为20~60cm的半径变化。另一种人工绘制的地图由窄的迷宫状结构组成,走廊宽度在0.6米到0.9米之间。
为了采集训练数据,我们利用Gazebo仿真环境[15]对Festo.actics提出的全向机器人模型进行了仿真。我们首先计算从机器人当前位置到目标位置的全局路径,然后让机器人使用DWA控制器跟随该路径。
为了获得地面真值数据,我们测量机器人位置接近目标位置的x坐标时的任务完成时间。不考虑最后航向。在每个实验中,随机选择机器人的起始位置、初始航向和目标位置。我们使用了一个A*规划师来计算全局路径。基于网格的路径的长度在4m到50m之间变化。A*规划器和DWA控制器在ROS导航堆栈中实现[16]。

在实验过程中,导航系统参数的选择对机器人的性能有着至关重要的影响。我们发现以下参数在实践中是最好的。我们使用的分辨率为5厘米的全球成本图的环境和1厘米的地方地图。控制回路的频率设定为8Hz局部成本曲线的大小设定为1.5m×1.5m最大线速度设定为0.6m/s最大转速设定为0.6rad/s,直线运动和旋转运动的加速度极限设定为0.7m/s2。分别为0.7rad/S2。自然地,底层物理系统的能力被灌输到训练有素的回归器中。稍后对配置参数的偏离可能在某种程度上起作用,到目前为止,我们在工作中还没有对此进行评估,但一般必须假设该模型不能传输到具有明显不同导航能力的新系统。每个机器人和导航软件的组合必须进行训练。
我们创建了两个数据集每个数据集包含5500个导航任务第一个数据集被收集在没有任何噪声源的情况下,即传感器中没有噪声,也没有车轮的滑动。特别是这还包括一个完美的本地化。当然,这个模型并不完全现实,但是它有助于分析关于特征与估计的相关性的数据。第二组数据是从使用定位系统的实验中收集的,该定位系统由于错误的姿态估计而增加了仿真中的噪声。注意,在第二数据集中,传感器和运动本身仍然是无噪声的。利用这两个数据集,我们可以比较无噪声结果来评估带有噪声的模型,并且还可以看到系统中的噪声对导航性能的影响程度。

B.回归结果

在这一节中,我们给出了回归分析的结果。对于每一个数据集,我们学习了每个不同方法的估计器。我们使用一个简单的线性回归(SLR)方法,该方法基于如方程(1)中计算的路径长度,一个线性回归(LR)模型,它考虑了上述所有特征(参见Sec.IV-A),我们还训练了支持向量机回归(SVR),也使用所有的特征。对于培训和测试,我们使用WEKA,一个成熟的数据挖掘软件〔17〕。为了评估不同的回归模型,我们对数据集执行了10倍的交叉验证,即在一次验证运行期间,90%的数据集用于培训,而另外10%的数据集用于测试该特定模型。在下一轮验证中,另一个10%的子集用于测试,我们重复这个过程10次,直到数据集的每个子集都经过测试。我们计算了每十次测试运行的均方根误差(RMSE)的平均值。作为参考,我们还计算了整个数据集上的常数平均估计的RMSE。假设线性分布是不够的,尤其是在存在杂波和窄间隙的情况下,我们的导航系统表现出高度非线性的行为。然而,线性模型易于拟合,计算速度快,是一个很好的参考。图5示出了在路径长度上的数据集中的每一次运行的完成时间(根据公式(1)计算)。注意,围绕线性回归线(蓝色)的数据点(黄色)的传播随着路径长度的增加而增加。


图6所示的回归结果显示了SEC中引入的特征。IV对时间估计有很大影响,因为我们可以看到,与SLR相比,LR的两个数据集有14%的改进。使用非线性模型可以进一步减小预测误差。使用SVR得到的RMSE与具有完美定位的数据集的LR和噪声定位的22%相比进一步降低了15%。这些结果支持了系统的高度非线性,如果需要更精确的估计,则线性回归方法是不够的。
通过比较两个数据集,我们可以清楚地看到噪声局部化的影响。仿真结果还表明,由于与理想定位相比,在噪声情况下,从LR到SVR的误差减小幅度更大,因此本文的方法可以估计出部分噪声。这种改进源于这样的事实,即更高的定位误差与某些非线性行为相关,例如,在现场快速旋转或穿越仅具有少数特征的单调环境。因此,非线性SVR方法最适合于真实世界场景。图6所示的评价非常适合于不同回归方法的比较。此外,我们对估计的相对根均方误差感兴趣,其定义如下:

其中Yi是实验i的完成时间,Yi是对应的估计值,N是一组实验的数目。由于我们评估了包含非常短路径和非常长路径的多种情况,est是对每个实验的相对偏差的更好的度量,因为我们首先通过相应的完成时间来缩放每个单独的平方误差。由于与SLR相比优越的性能,我们计算了LR和SVR的等式(5)的值。对于LR和SVR,Sig-EST分别计算为0.32和0.13。这些结果表明,SVR的使用不仅大大降低了平均偏差,而且对路径长度的整个谱显示出改进的估计。这些结果表明,我们的方法能够预测路径完成时间,平均误差仅为13%。

 

C.时间增益
为了演示在应用我们的预测时的时间增益,我们在完全新的地图上进行了实验(参见图7)。在这个实验中,存在三个不同的路径选择,从开始导航到目标位置。第一个选项是最短路径(蓝色),它通过狭窄的区域。红色路径是最长的,但它是光滑的,并且具有很高的障碍。第三个备选方案包括其他两个路径的段。根据该方法预测的完成时间,选择最长路径作为最快选项,然后选择最短路径。根据我们的预测,第三条路径是最慢的。通过执行模拟中的所有三个选项,Tab中的实际完成时间。我确认了预测和路径选择。与执行最短路径相比,执行红色路径时的实际时间增益为6s,这是旅行时间的9.8%。

六、结论

在本文中,我们提出了一种技术来估计2D网格路径的完成时间。完成时间一般不预先知道,因为它强烈地依赖于底层运动控制器的能力。通过利用三个一般特征对路径进行低维分类,并模拟不同类型地图上的各种运动任务,我们能够回归一个估计器,该估计器在运动执行st之前以大约10%的低误差预测路径完成时间。艺术。当然,由于完成时间强烈地依赖于机器人的导航性能,因此需要针对特定的硬件和运动控制器组合对其进行单独训练。

REFERENCES
[1] P. E. Hart, N. J. Nilsson, and B. Raphael, “A formal basis for the heuristic determination of minimum cost paths,” IEEE Transactions on Systems Science and Cybernetics, vol. 4, no. 2, pp. 100–107, 1968.
[2] J. Minguez and L. Montano, “Nearness diagram (ND) navigation: Collision avoidance in troublesome scenarios,” IEEE Transactions on Robotics, vol. 20, no. 1, 2004.
[3] O. Brock and O. Khatib, “High-speed navigation using the global dynamic window approach,” in Proc. of the IEEE Int. Conf. on Robotics & Automation (ICRA), 1999.
[4] D. Fox, W. Burgard, and S. Thrun, “The dynamic window approach to collision avoidance,” IEEE Robotics & Automation Magazine, pp. 23–33, 1997.
[5] M. Buehler, K. Iagnemma, and S. Singh, The DARPA Urban Challenge: Autonomous vehicles in city traffic. Springer, 2009. 
[6] S. Thrun, M. Bennewitz, W. Burgard, F. Dellaert, D. Fox, D. Hahnel, ¨ C. Rosenberg, N. Roy, J. Schulte, and D. Schulz, “Minerva: A secondgeneration museum tour-guide robot,” in Proc. of the IEEE Int. Conf. on Robotics & Automation (ICRA), 1999.
[7] C. Lau, B.and Sprunk and W. Burgard, “Kinodynamic motion planning for mobile robots using splines,” in Proc. of the IEEE/RSJ Int. Conf.on Intelligent Robots & Systems (IROS), 2009.
[8] L. Murphy and P. Newman, “Risky planning on probabilistic costmaps for path planning in outdoor environments,” IEEE Transactions on Robotics, vol. 29, no. 2, pp. 445–457, 2013.
[9] J. Bohren, R. B. Rusu, E. G. Jones, E. Marder-Eppstein, C. Pantofaru, M. Wise, L. Mosenlechner, W. Meeussen, and S. Holzer, “Towards ¨ autonomous robotic butlers: Lessons learned with the PR2,” in Proc. of the IEEE Int. Conf. on Robotics & Automation (ICRA), 2011, pp. 5568–5575.
[10] E. Marder-Eppstein, E. Berger, T. Foote, B. Gerkey, and K. Konolige, “The office marathon: Robust navigation in an indoor office environment,” in Proc. of the IEEE Int. Conf. on Robotics & Automation (ICRA), 2010.
[11] C. Stachniss and W. Burgard, “An integrated approach to goaldirected obstacle avoidance under dynamic constraints for dynamic environments,” in Proc. of the IEEE/RSJ Int. Conf. on Intelligent Robots & Systems (IROS), 2002.
[12] H. Jun and Z. Qingbao, “Multi-objective mobile robot path planning based on improved genetic algorithm,” in Int. Conf. on Intelligent Computation Technology and Automation (ICICTA), vol. 2, 2010, pp. 752–756.
[13] R. Philippsen, S. Kolski, K. Macek, and B. Jensen, “Mobile robot planning in dynamic environments and on growable costmaps,” in Workshop on Planning with Cost Maps at the IEEE Intl. Conf. on Robotics and Automation, 2008.
[14] P. Regier, S. Oßwald, P. Karkowski, and M. Bennewitz, “Foresighted navigation through cluttered environments,” in Proc. of the IEEE/RSJ Int. Conf. on Intelligent Robots & Systems (IROS), 2016.
[15] N. Koenig and A. Howard, “Design and use paradigms for Gazebo, an open-source multi-robot simulator,” in Proc. of the IEEE/RSJ Int. Conf. on Intelligent Robots & Systems (IROS), 2004.
[16] M. Quigley, K. Conley, B. Gerkey, J. Faust, T. Foote, J. Leibs, R. Wheeler, and A. Y. Ng, “ROS: An open-source robot operating system,” in ICRA Workshop on Open Source Software, 2009.
[17] M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann, and I. H. Witten, “The weka data mining software: an update,” ACM SIGKDD explorations newsletter, vol. 11, no. 1, pp. 10–18, 2009.

 

 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值