图搜索的经典启发式算法A星(A*、A Star)算法详解


1. 引言

在许多场景中,我们常会遇到一类问题,即“找到一个位置到另一个位置的距离最短(用时最少)的路径”,解决这类问题可以将实际问题映射到一张网络图上,并通过图搜索算法进行求解,这里所说的图搜索算法指的是一系列基于图的算法,而本文将介绍的 A* 算法是其中最为流行的启发式搜索算法,由于 A* 算法结合了其他的基础图搜索的特点,因此本文将从最简单的图搜索算法“广度优先搜索”开始介绍,逐步扩展至 A* 算法。

在这里插入图片描述

刚才提到,图搜索算法都需要基于一张图,即将实际的复杂的地图映射成具有固定节点( N o d e s Nodes Nodes)和边( E d g e s Edges Edges)的图( G r a p h Graph Graph),有些边是有方向限制的,为弧 A r c s Arcs Arcs。具体的映射方式很多,即同样一张地图,可以映射成具有 10 10 10 个节点的路线图,也可以映射成 100 100 100 个节点的网格图,在求解过程中,节点数越多的图的求解时间越长,尽管它在一定程度上更能近似于实际情况且更易处理。

2. 广度优先搜索

广度优先搜索(Breadth First Search, BFS)原本是一种在树形数据结构中搜索满足给定属性的节点的算法,后在 1961 年由 CY Lee 等人开发成一种路径搜索算法。

在图搜索中,有一个称为待探索边界 f r o n t i e r frontier frontier 的概念,即图搜索算法基于起点,不断地推进待探索边界,直到该边界触碰到目标点时结束,而由于该算法的特点是在所有方向上平等地探索,因此这个推进待探索边界的过程也被称为“洪水填充 ( f l o o d   f i l l ) (flood\ fill) (flood fill)”,该算法由于简单易实现的特性,在许多寻路和图分析场景都有应用,具体如下图所示。

在这里插入图片描述

这里的 f r o n t i e r frontier frontier 在代码实现中,是一个待探索的节点队列。队列的初始元素为起始点,基于起始点向前一步探索(下一步可以走到哪些节点),将这些相邻节点扩展到 f r o n t i e r frontier frontier 队列当中,以此类推。每扩展一个节点,记录下该节点的父节点,方便在探索到目标节点后,返回出最优路线。该算法在路径搜索问题上的逻辑如下(伪代码):

frontier = Queue() 			# 生成一个队列
frontier.put(start)			# 以起点作为开始
came_from = dict() 			# path A->B 存储为 came_from[B] == A
came_from[start] = None		# 存储每个节点的上一个位置

while not frontier.empty(): # 只要边界队列不为空就循环下去
   current = frontier.get() # 从边界中取出一个点
   if current = goal:		# 算法终止机制,判断当前节点是否为目标点
      break					# 路径长度限制、遍历的点数、寻到的目标点数......都可以是终止约束
   for next in graph.neighbors(current): # 基于这个点向相邻的点进行扩展
      if next not in came_from: # 只要这个扩展的点不曾遍历到,就添加到边界中和已遍历节点集合中
         frontier.put(next)
         came_from[next] = current

# 获得最有路线
current = goal 
path = []
while current != start: 
   path.append(current) # 从目标点回溯到起点
   current = came_from[current]
path.append(start)
path.reverse() 			# optional 获得最优路线

3. Dijkstra 算法

前文的广度优先搜索算法,在待探索边界上,以同样的权重按顺序地推进待探索边界,即认为每个边的权重是一致的,但在实际的许多场景中,连接节点的边的权重往往并不相同,显然,在相同的探索深度下,累计代价最小的节点有更大的概率探索到总代价 g ( n ) g(n) g(n) 小的路线,因此基于广度优先搜索的思路,将待探索边界从普通队列变更为优先队列,评估优先顺序时考虑当前节点到起始点的距离(成本)。

常常用 g ( n ) g(n) g(n) 表示从起始节点到 n n n 节点的路径成本。

由于 Dijkstra 算法带有权重地进行探索,改变了 f r o n t i e r frontier frontier 的推进方向,因此有可能出现多次(不同路线)探索同一个节点的情况,对于已经探索过的节点,如果新路线的累积代价更小,则更新该节点的信息。基于 Dijkstra 算法的伪代码如下:

frontier = PriorityQueue()			# 生成优先队列
frontier.put(start, 0)				# 优先遍历队列中优先度更好(小)的节点
came_from = dict()
cost_so_far = dict()				# 存储节点和起点之间的距离
came_from[start] = None
cost_so_far[start] = 0

while not frontier.empty():
   current = frontier.get()
   if current == goal:
      break
   for next in graph.neighbors(current):
      new_cost = cost_so_far[current] + graph.cost(current, next)
      if next not in cost_so_far or new_cost < cost_so_far[next]:
         # 判断新的总移动成本,
         cost_so_far[next] = new_cost
         priority = new_cost
         frontier.put(next, priority)
         came_from[next] = current

与广度优先搜索算法一样,Dijkstra 算法能保证最终找到最优的路径,而 Dijkstra 算法相比广度优先搜索节省了大量的计算时间。

4. 启发式优先搜索(Heuristic)

前面提到的广度优先搜索和 D i j k s t r a Dijkstra Dijkstra 算法适合于找单个起点到多个节点的路径;而如果是找单个起点到具体某一个节点的路径,则由于我们的目标很明确,我们希望从目标节点中获取启发信息,例如在探索节点时,优先探索距离目标点更近的节点。当然,这里的“距离近”并不一定是真实距离,它为待探索边界的优先顺序提供了一定的启发信息。

例如:这里用当前点与目标点之间的曼哈顿距离作为启发信息:

def heuristic(a, b):
   # Manhattan distance on a square grid
   return abs(a.x - b.x) + abs(a.y - b.y) # 这里用的简答的曼哈顿距离

4.1 贪心最佳优先搜索

在启发式搜索方法中,最简单易实现的是贪心最佳优先搜索(Greedy Best First Search, GBFS),即优先探索距离目标最“近”的节点,在一些情况下,该算法的效率极高,但对于较为复杂(待障碍物等)的图搜索问题,该算法往往不能保证找到最优的路径

算法逻辑其实就是在广度优先搜索 B F S BFS BFS 算法上,增加启发信息 h e u r i s t i c heuristic heuristic,具体的伪代码如下:

frontier = PriorityQueue()
frontier.put(start, 0)
came_from = dict()
came_from[start] = None

while not frontier.empty():
   current = frontier.get()

   if current == goal:
      break
   
   for next in graph.neighbors(current):
      if next not in came_from:
         priority = heuristic(goal, next)
         frontier.put(next, priority)
         came_from[next] = current

对于节点到目标点的估计距离,常常用符号 h ( n ) h(n) h(n) 进行表示。

4.2 A*搜索

前面提到的三种图搜索算法都各有优势,而 A* 算法简单而言,就是既学 Dijkstra 算法参考已产生的累积代价,又学了贪心最佳优先搜索参考了与目标节点的启发信息。前者能保证找到最优路线,而后者能提高算法的求解效率。

对于图中的每条边 ( x , y ) (x,y) (x,y),用 d ( x , y ) d(x,y) d(x,y) 表示边的长度,用 h ( x ) h(x) h(x) 表示节点 x x x 到目标点的估计距离,如果恒满足 h ( x ) ≤ d ( x , y ) + h ( y ) h(x)\leq d(x,y)+h(y) h(x)d(x,y)+h(y),则可得 f ( x ) = h ( x ) + g ( x ) ≤ g ( x ) + d ( x , y ) + h ( y ) = f ( y ) f(x)=h(x)+g(x)\leq g(x)+d(x,y)+h(y)=f(y) f(x)=h(x)+g(x)g(x)+d(x,y)+h(y)=f(y),此时 h h h 满足三角不等式,可以称之具备一致性,通过一致性的 h h h 函数,能使 A* 算法一定找到最优路径。

具体 A* 算法的计算逻辑伪代码如下:

frontier = PriorityQueue()
frontier.put(start, 0)
came_from = dict()
cost_so_far = dict()
came_from[start] = None
cost_so_far[start] = 0			# 与起点的距离

while not frontier.empty():
   current = frontier.get()

   if current == goal:
      break
   
   for next in graph.neighbors(current):
      new_cost = cost_so_far[current] + graph.cost(current, next)
      if next not in cost_so_far or new_cost < cost_so_far[next]:
         cost_so_far[next] = new_cost
         priority = new_cost + heuristic(goal, next) # 与目标点的估计距离
         frontier.put(next, priority)
         came_from[next] = current

A* 算法综合考虑 g ( n ) g(n) g(n) h ( n ) h(n) h(n),如果 A* 算法中当前点到目标点的估计距离相对于与起点的实际距离很小,与起点的距离主导边界队列的搜索顺序,则 A* 算法表现出 D i j k s t r a Dijkstra Dijkstra 算法的性能;反之,则表现出类似 G B F S GBFS GBFS 的搜索性能。

总体而言, B F S BFS BFS 无差别地探索所有的路径,但是复杂度太高,但适用于目标节点未知(寻宝)的情况; D i j k s t r a Dijkstra Dijkstra 算法能保证找到最短路径,但因为没有用到目标点的信息,在探索方向上会花费大量时间; G B F S GBFS GBFS 仅向着目标点优化,算法的效率很高,但是不能保证找到最优路径;而 A ∗ A^* A 算法既考虑了和起点的距离,也考虑了和目标点的距离(两者求和),在预估函数满足一定条件下,能保证找到最优解,效率比 D i j k s t r a Dijkstra Dijkstra 算法高一些,比 G B F S GBFS GBFS 算法低一些。

  • 26
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Lins号丹

小小鼓励,满满动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值