经典图论算法回顾之Dijkstra算法

Researcher-Du

已于 2024-08-04 20:26:31 修改

阅读量785

点赞数 10

分类专栏： Algorithm 文章标签：图论最短路径算法 Dijkstra算法

于 2024-08-04 01:59:05 首次发布

本文链接：https://blog.csdn.net/u011426016/article/details/140895213

版权

Algorithm 专栏收录该内容

23 篇文章 2 订阅

订阅专栏

Dijkstra（题外话：正确读音为/ˈdaɪkstrə/，音译应该是戴克斯彻，而不是广为人知的迪杰斯特拉）是荷兰著名的计算机科学家，他本人也因诸多计算机领域的突破性贡献而获得1972年的图灵奖。今天要回顾的Dijkstra（单源最短路径）算法发明于1959年，被大家评为“统治世界的十大算法”之一。

在这里插入图片描述

图1. Edsger W. Dijkstra 1930-2002

〇、一种有趣的解法

对于任意的图 $G = (V, E)$ , 源点为 $s$ , 我们可以对应地制作一张网：顶点用串珠代替，顶点之间的边则用线连接（线的长度由权重决定）。那么，任意点 $u$ 到源点 $s$ 的距离怎么算呢？很简单，一只手抓住 $s$ , 另一只手抓住 $u$ , 将两点拉直，则 $s, u$ 之间绷直的线段的长度之和就是他们的最短距离。如图2（图片来自于清华大学邓俊辉老师的课件）所示。

思路看上去很简单，但却不可实现，我们难以做出非常复杂的网，也没有那么长的手可以抓住任意两个点并拉直。那么，Dijkstra如何解决这个问题呢？
在这里插入图片描述

图2. 一种直观的解法

一、最短路径树

为了描述Dijkstra算法，我们先介绍最短路径树（Shortest Path Tree，SPT）的概念。在一个连通图中，给定的源点 $s$ 到每个点至少存在一条最短路径（可能存在多条长度相等的最短路径），且所有点的最短路径的并不包含回路，也就是一棵树，一般称为最短路径树。

图3给出了一个例子，左侧为给定的图（左上角为源点 $s$ ）, 右侧为其对应的最短路径树。
在这里插入图片描述

图3. 最短路径树的构造1

这里有人可能会质疑，如果源点到某个点的最短路径有多条，则所有最短路径的并可能包含回路，从而无法构成最短路径树。如下图所示，我们若设定 $w (A . B) = 23$ ，则 $s$ 到 $B$ 的最短路径存在两条： $\rightarrow A \rightarrow B$ 和 $\rightarrow C \rightarrow B$ 。对于这种情况，我们只需删除 $\rightarrow B$ 或 $\rightarrow B$ 中的任意一条边即可，并不影响最终的结论，从而仍然可以构造一棵最短路径树。

有了最短路径树后，我们就可以通过深度遍历的方式轻松获取每个顶点到源点的最短路径及其长度。
在这里插入图片描述

图4. 最短路径树的构造2

二、Dijkstra算法的思想

注：此部分内容主要参考清华大学邓俊辉老师的课件，再次表示感谢！
给定图 $G = (V, E)$ , 源点为 $s$ ，令:
$d (s, u)$ ：表示源点到 $u$ 的最短距离的估计（估计值一般大于最短距离，通常会逐步逼近最短距离）。
$\delta(s,u)$ ：表示源点到 $u$ 的最短距离。
$w (u, v)$ ：表示边 $(u, v)$ 的权重。

我们期望由近及远的方式确定所有点到源点的最短距离。也就是说，越早确定的点离源点越近，越晚确定的点离源点越远。我们将所有点按照到源点的距离排序如下：
$\delta(s,u_1) \leq \delta(s,u_2) \cdots \leq \delta(s,u_{|V|-1}) , u_{1...|V|-1} \in V-s$
注意：这里使用 $u_i$ 主要是跟 $v_i$ 区分开， $u_i$ 不一定等于 $v_i$ 。

我们将图3再次搬下来，可以发现：从源点开始，沿任意最短路径，各顶点到源点的最短距离单调递增。 下面给出了几条路径（顶点后面的数值表示到源点的最短距离）：
1） $\rightarrow A(9)$
2） $\rightarrow F(15)$
3） $\rightarrow C(14) \rightarrow B(32) \rightarrow D(34) \rightarrow E(45)$
4） $\rightarrow C(14) \rightarrow B(32) \rightarrow D(34) \rightarrow G(50)$

那么， $u_1 = ?$
根据以上观察，我们说 $u_1$ 必定与 $s$ 直接相连。
为此，只需要找到 $s$ 的邻接点中与 $s$ 距离最近的点即可。
下图中， $w (s, A) = 9 < w (s, C) = 14 < w (s, F) = 15$ , 因此 $u_1 = A$ , $\delta(s,u_1) = 9$ 。
接下来， $u_2 = ?$
不难发现， $u_2$ 可能的情况：1）接在 $u_1=A$ 之后，2）与 $s$ 直接相连（开辟一条新的路径）。
下图中， $\delta(s,A) + w(s,F)=34$ , 因此 $u_2 = C$ , $\delta(s,u_2) = 14$ 。
接下来， $u_3 = ?$
不难发现， $u_3$ 可能的情况：1）接在 $u_1 = A$ 之后，2）接在 $u_2 = C$ 之后，3）与 $s$ 直接相连（开辟一条新的路径）。
下图中， $\delta(s,C) + w(C,F)=19 < \delta(s,A)+w(A,B)=34 \cdots$ , 因此 $u_3 = F$ , $\delta(s,u_3) = 15$ 。

在这里插入图片描述

最后，一般意义下， $u_k = ?$
我们发现待确定的下一个顶点总是在已确定顶点的基础上扩展得到的。确定所有点的最短路径的过程，其实就是从无到有生成最短路径树的过程。

我们令 $T_n$ 表示图 $G$ 的最短路径树， $T_i$ 表示包含 $i$ 个顶点的最短路径树 $T_n$ 的子树。如上所述，一旦构造出最短路径树，那么所有顶点的最短路径也就显而易见了。接下来，我们就来渐进地构造这样一棵最短路径树。

我们从只包含源点的树 $T_1 = ({u_0}, \varnothing)$ 开始逐步构造 $T_2,T_3,\cdots,T_n$ 。

假设 $k$ 步之后， $T_k = (V_k, E_k)$ , 其中， $V_k| = k, |E_k| = k-1$ 。

为了从 $T_k$ 构造 $T_{k+1}$ ，我们只需要将 $V_k$ 和 $V-V_k$ 视为原图的一个割，并在割的所有跨边中找出最小者： $e_k = (v_k,u_k)$ （ $u_k$ 到源点距离最近），然后将 $u_k$ 和 $e_k$ 接入 $T_k$ 即可：
$T_{k+1}= (V_{k+1}, E_{k+1}) = (V_k\cup u_k, E_k \cup e_k)$

同时需要注意的是，当扩充 $u_k$ , 我们需要更新它的邻接点到源点的最短距离：
$\delta(s,u_k) + w(u_k,x))$
其中， $x$ 表示集合 $V-V_{k+1}$ 中 $u_k$ 的邻接点（已经确定最短路径的邻接点不必更新）。

图5给出了该算法的一个示例。
在这里插入图片描述

图5. 构造最短路径树的过程（A为源点，阴影部分与非影响部分构成一个割）

三、另一种理解方式（悬挂法）

我认为另一种非常好理解的方式是悬挂法。这种方法是这样做的，我们还是将图制作成一张网，将其置于桌面上，然后用右手抓住代表源点（ $u_0 = s$ ）的珠子，缓缓将其从桌面提起来。第0棵离开桌面的珠子是源点本身，第1棵拉起来的珠子是 $u_1$ , 接下来是 $u_2, u_3...u_{|V-1|}$ 。

之前邓俊辉老师讲过这种方法，我从斯坦福大学找到了类似的课件，分享如下：
在这里插入图片描述

图6. 悬挂法理解Dijkstra算法

可以直观地发现，我们将源点（ $u_0 = Gates$ ）慢慢从桌面拉起来时，与源点直接相连的点将首先被提起来（ $u_1 = Packard$ ）。接下来 $u_2$ 要么跟Gates相连，要么跟Packard相连，这里 CS161跟源点最近，因此 $u_2 = CS161$ 被提起来。重复此操作，直到 $u_4 = Dish$ 被拉起来，最终最短路径树被构造出来。

四、算法代码（非队列优化）

在这里插入图片描述

图7. Dijkstra算法代码

五、Dijkstra算法的问题

Dijkstra算法的主要问题是不能处理负权边，图8给出了两个例子。

在上方的例子中，Dijkstra算法第一次确定的顶点是 $v_2$ ，其到源点的最短距离为 2，但是真正的最短路径为 $v_0 \rightarrow v_1 \rightarrow v_2$ , 距离为 1。Dijkstra算法中，已经确定的点的最短距离将不再改变。另一方面，参考悬挂法，珠子之间的线不可能是负数。
在下方的例子中，存在负权回路 $v_1 \rightarrow v_2 \rightarrow v_3 \rightarrow v_1$ , 绕的次数越多最短距离越小，本质上没有最短只有更短。