在上一篇文章中,我介绍了图(Graph)的概念。这篇文章和未来几篇文章中,我主要讨论关于图的一些经典问题和解决这些问题的经典算法。首先是图的最短路径问题。
1. 图的最短路径(Shortest Path)问题
首先来讨论图的最短路径问题。举一个例子,我们可以把中国的地图看做一个图,把每一个城市看做图中的一个顶点,把相邻城市的高速公路当做一条边。那么,如果我想从北京出发去上海,要经过哪些城市才能使得走过的距离最短呢?
这就是图的最短路径问题。给定一个图,图中每一条边都有一个权重(weight)。比如上面的例子中每两个城市之间的高速公路是一条边,公路长度是权重。最短路径问题就是求有向图中给定两个顶点之间的一条路径,使得该条路径上所有边的权重的和最小。例如下面的这个图,图中红色的三条边和四个蓝底的顶点所组成的路径即是PVD到HNL的最短路径。也就是说,在图中,从PVD道HNL的所有路径中,我们找不到任何一条其他路径比这条路径还要“短”(也就是边的权重之和最小)。
2. 最短路径的特性
若一条路径是一个图中两个顶点之间的最短路径,那么该路径有如下特性:
- 该路径的子路径也是一条最短路径。比如上图中的最短路径的一条子路径是从PVD到ORD到LAX。这条子路径也是从PVD到LAX的最短路径。
- 图中存在这样一棵树,该树用来表示从该路径的出发点到图中所有其他顶点的最短路径,而且这条最短路径是树的一个树枝(其实该树就是这个图的最小生成树,这个概念我会在以后介绍)。
下面的图中就是这棵树的例子。该树的根节点(root)为PVD。
3. 用Dijkstra算法求解最短路径问题
对于解决最短路径问题的解法,我们最先想到的,也是最直观的解法,可能就是求出图中两个点之间的每一条路径,然后计算每一条路径的总权重,总权重最小的那条路径就是最短路径。但是,即便是在不允许环路(即重复经过某个顶点)的情况下,也可以看出,我们需要检查大量的路径,而其中很多路径根本不值得检查。比如从北京到上海,经过西藏的路径显然不是最短路径。
Dijkstra算法通过贪心策略解决了这个问题。(还记得贪心策略吗?在算法导论随笔(六):贪心算法Greedy algorithm与分数背包问题(附Python实现源码)中,忘了的同学可以去复习一下)。贪心策略的基本思想就是在每一步中都选择目前收益最大的操作。这也符合了最短路径的第一条特性:一个最短路径的子路径仍然是最短路径。Dijkstra算法有一个前提条件,即图中的每一条边的权重都不能是负值。因此,在讨论Dijkstra算法之前,我们先规定,对于接下来要讨论的图
G = ( V , E ) G = (V, E) G=(V,E)
我们有
∀ e = ( u , v ) ∈ E ,