《Anytime Dynamic A*: An Anytime, Replanning Algorithm》论文 个人读后小结

这篇论文主要介绍了三种算法,分别是

1. Dynamic Replanning Algorithms:就我们常说的动态规划算法,论文中主要以D* Lite为例进行了简单的介绍。

2. Anytime Algorithms:这一类算法不要求规划出最小代价路径,而要求在有限的时间内规划出一个epsilon-suboptimal solution,可以理解为一个次优解。

3. Anytime Dynamic A* (记作:AD*): 结合上面D* Lite算法和ARA*算法提出的一种新的算法。


D* Lite算法

D* Lite算法主张规划出一个从起点到终点的最小代价路径。为此,算法中提出了2个估计值,分别是:

g(s)  --- > 表示 结点s到goal结点的代价估计值

rhs(s) --->表示 a one-step lookahead cost:


其中Succ(s)表示s的后向结点集合,c(s,s')表示从结点s到s'的代价,即我们常说的路权。

详细了解可以阅读论文

下面是D* Lite算法伪代码:



ARA*算法


这里主要介绍的是一种与规划时间有关的A*-based算法。在很多情况下,最短路径不一定就是我们想要的,还需要考虑时间等因素。在有限的时间内得到好的、可行的结果才是我们想要的。ARA*算法就是解决这类问题的。

在学习A*算法时我们了解到: f(n)=g(n)+h(n)中关于h(n)的选取:

用d(n)表达状态n到目标状态的距离,那么h(n)的选取大致有如下三种情况:

1  如果h(n)< d(n)到目标状态的实际距离,这种情况下,搜索的点数多,搜索范围大,效率低。但能得到最优解。
2  如果h(n)=d(n),即距离估计h(n)等于最短距离,那么搜索将严格沿着最短路径进行, 此时的搜索效率是最高的。
3  如果 h(n)>d(n),搜索的点数少,搜索范围小,效率高,但不能保证得到最优解。

第三种情况说到,当h(n)>d(n)的时候,会搜索较少的点,快速的产生一个解。ARA*算法就是用到了这一点(至少我是这样理解,如有误,欢迎指出)

        key(s)的计算中,它用到了epsilon*h(Sstart,S),且epsilon>1(比如后面的实验中用到的2.5,1.5).此时快速得到一个解,然后减小epsilon的值,继续规划新的更好的解(epsilon=1)。如果给出的限定时间到了,则输出当前的最新可行解(epsilon-suboptimal solution)。

        论文中关于epsilon如何减小没有提到。



AD*算法

As shown in the previous sections, there exist efficient algorithmsfor coping with dynamic environments (e.g. D* andD* Lite), and complex planning problems (ARA*). However,what about when we are facing both complex planningproblems and dynamic environments at the same time?

AD*算法就是结合了上面两种情况提出的新算法,算法伪代码如下:




  • 1
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值