详解Dijkstra算法（含数学证明和优化）

最新推荐文章于 2025-03-22 23:40:22 发布

数据刘

最新推荐文章于 2025-03-22 23:40:22 发布

阅读量2w

点赞数 65

分类专栏：数据结构文章标签： dijkstra 计算机科学算法数学

本文链接：https://blog.csdn.net/CrazyKeyboardMan/article/details/78219970

版权

数据结构专栏收录该内容

1 篇文章

订阅专栏

Dijkstra算法简介：

Dijkstra算法是由荷兰计算机科学家Edsger Wybe Dijkstra于1959年提出的一种解决有向加权图中单源最短路问题的算法，其中要求加权图中不可有负权边。

Dijkstra算法步骤演示：

以如下的一张有向正权图G为例，规定：
- 起点为A
- 向量 $\vec{xy}表示从顶点x到顶点y的有向边$
- $向量的模\left|\vec{xy}\right|表示有向边\vec{xy}的权值$

有向图G

初始状态：
　　设起点到各点当前最短距离为 $L_k (k=A,B,C,D,E)，则有：$
$L A = 0$ $L_A=0$
并设此时
$L B 至 L E = + \infty$ $L_B至L_E=+\infty$
则可列表：

	$L_A$	$L_B$	$L_C$	$L_D$	$L_E$
初始状态	0	$+\infty$	$+\infty$	$+\infty$	$+\infty$

第一次迭代：
　　从起点A点出发，更新起点到A的邻居（B、C、D）的当前最短距离（ $L_k$ ）。此时：
对B：
$L B = ∣ ∣ ∣ A B \to ∣ ∣ ∣ = 10$ $L_B=\left|\vec{AB}\right|=10$ 对C：
$L C = ∣ ∣ ∣ A C \to ∣ ∣ ∣ = 3$ $L_C=\left|\vec{AC}\right|=3$ 对D：
$L D = ∣ ∣ ∣ A D \to ∣ ∣ ∣ = 20$ $L_D=\left|\vec{AD}\right|=20$
则可列表：

	$L_A$	$L_B$	$L_C$	$L_D$	$L_E$
第一次迭代后	0	10	3	20	$+\infty$

第二次迭代：
　　找出第一次迭代后除已处理过的起点A外， $L_k$ 最小的点：C
　　从C出发，更新C邻居（B、E）的 $L_k$ 值，此时：
对B：
　　经过C到达B的路径长度：
$L = L C + ∣ ∣ ∣ C B \to ∣ ∣ ∣ = 5$ $L=L_C+\left|\vec{CB}\right|=5$ $∵ L B = 10 > L$ $\because L_B=10>L$ $∴ 更新 L B = L = L C + ∣ ∣ ∣ C B \to ∣ ∣ ∣ = 5$ $\therefore 更新L_B=L=L_C+\left|\vec{CB}\right|=5$
对E：
　　经过C到达E的路径长度：
$L = L C + ∣ ∣ ∣ C E \to ∣ ∣ ∣ = 18$ $L=L_C+\left|\vec{CE}\right|=18$ $∵ L E = + \infty > L$ $\because L_E=+\infty>L$ $∴ 更新 L E = L = L C + ∣ ∣ ∣ C E \to ∣ ∣ ∣ = 18$ $\therefore 更新L_E=L=L_C+\left|\vec{CE}\right|=18$
则可列表：

	$L_A$	$L_B$	$L_C$	$L_D$	$L_E$
第二次迭代后	0	5	3	20	18

第三次迭代：：
　　找出第二次迭代后，除已处理过的A、C两点外， $L_k$ 最小的点：B
　　从B出发，更新B邻居（D）的 $L_k$ 值，此时：
对D：
　　经过B到达D的路径长度：
$L = L B + ∣ ∣ ∣ B D \to ∣ ∣ ∣ = 10$ $L=L_B+\left|\vec{BD}\right|=10$ $∵ L D = 20 > L$ $\because L_D=20>L$ $∴ 更新 L D = L = L B + ∣ ∣ ∣ B D \to ∣ ∣ ∣ = 10$ $\therefore 更新L_D=L=L_B+\left|\vec{BD}\right|=10$
则可列表：

	$L_A$	$L_B$	$L_C$	$L_D$	$L_E$
第三次迭代后	0	5	3	10	18

第四次迭代：
　　找出第三次迭代后，除已处理过的A、B、C三点外， $L_k$ 最小的点：D
　　从D出发，更新D邻居（E）的 $L_k$ 值，此时：
对E：
　　经过D到E的路径长度：
$L = L D + ∣ ∣ ∣ D E \to ∣ ∣ ∣ = 21$ $L=L_D+\left|\vec{DE}\right|=21$ $∵ L E = 18 < L$ $\because L_E=18<L$ $∴ 不必更新， L E = 18$ $\therefore 不必更新，L_E=18$
则可列表：

	$L_A$	$L_B$	$L_C$	$L_D$	$L_E$
第四次迭代后	0	5	3	10	18

第五次迭代：
　　找出第四次迭代后，除已处理过的A、B、C、D四点外， $L_k$ 最小的点：E
　　此时，E没有邻居，因此对E的处理直接结束
　　
则可列表：

	$L_A$	$L_B$	$L_C$	$L_D$	$L_E$
第五次迭代后	0	5	3	10	18

五次迭代后，有向图G中所有的点都被处理过，算法终止，则整个迭代过程列表如下：

	$L_B$	$L_C$	$L_D$	$L_E$
初始状态	$+\infty$	$+\infty$	$+\infty$	$+\infty$
第一次迭代后	10	3	20	$+\infty$
第二次迭代后	5	3	20	18
第三次迭代后	5	3	10	18
第四次迭代后	5	3	10	18
第五次迭代后	5	3	10	18

　　不难观察到，Dijkstra算法的特点主要是从起点开始，“由近及远，层层扩展”，越靠前处理的点离起点越近，最后一个处理的点一定离起点最远。
　　所以，依据算法每找到一个顶点后，该顶点对应的 $L_k$ 值就是起点到该点的最短路径长度，且 $L_k$ 在这之后不会被更改。
　　而最后一次迭代得到的所有 $L_k$ 的值，就是由起点（亦称源点）A到各点的最短路径长度。
　　故Dijkstra算法解决的是有向图中的单源最短路问题。

算法概括：

步骤概括：
- 第一个核心步骤：找到当前未处理过的顶点中 $L_k$ 最小的点 $V$ ，（由于起点到起点的消耗为0，所以算法开始时V必定代表起点）；
- 第二个核心步骤：若V有邻居，则计算经过V的情况下起点到达各邻居的消耗 $L$ ，并选择是否更新 $V$ 邻居的 $L_k$ 值。若没有邻居则对该点的处理结束
- 重复以上两个核心步骤，直到满足算法终止的条件：有向图中所有的点都被处理过。
流程图：

数学描述及证明

Dijkstra算法的数学描述：
设全集 U ：有向图中所有的点的集合。
设点集S ：已经找到最短路径的点的集合，初始状态下设仅有起点∈S 。
设点集 Q ：还未找到最短路径的点的集合，显然Q=U−S。
设 Lk 为当前情况下，起点经过 $S$ 中若干点到点k的最短距离（ k∈U ），初始 L起点=0 ，其他均为 +∞ 。
算法开始：
- 从起点开始，沿某条弧（设权值为 $arcs$ ）找到起点的一个邻居 $n$
- 令 $L_n=min\{L_n,L_{起点}+arcs\}$
- 按此方式更新起点所有邻居
- 在集合 $Q$ 中找到 $L_k$ 最小的点 $v$ ，则 $L_v$ 即起点到 $v$ 的最短路径长度
- 将点 $v$ 从 $Q$ 中取出加入 $S$ ，对点 $v$ 重复上述所有操作
- 如此重复，直到 $S=U$ ，即 $Q=\emptyset$ 时，算法结束， $L_k$ 即为从起点到各点的最短路径长度

提醒：这里读者一定要反复仔细体会 $L_k$ 的含义，它不断更新的过程正是Dijkstra算法“由近及远，层层扩展”特点的体现。同时思考一下之前提过的“找到一个点后，该点 $L_k$ 值肯定不会被更改”的原因（理解 $L_k$ 的含义后，原因其实是显而易见的）。

Dijkstra算法的数学证明：
由算法的数学描述，可知：
只有命题：“每次从 $Q$ 集中找到 $L_k$ 最小的点 $v$ ， $L_v$ 即为从起点到 $v$ 的最短路径长度”正确时，算法正确。
可用广义数学归纳法证明，设起点为 $o$ ：

证明：算法找到的第一个点为 $v_1$ ， $L_{v_1}$ 即为从起点到 $v_1$ 的最短路径长度。
$用反证法：$
$\because 算法找到的第一个点一定是起点o最近的邻居$
$假设L_{v_1}不是从起点到v_1的最短路径长度$
$则\exists点v，使得\left|\vec{ov}\right|<\left|\vec{ov_1}\right|，与已知矛盾$
$故假设不成立，子命题得证$
证明：已用算法从 $Q$ 中依次找到了 $v_1,v_2,\cdots,v_k$ 共 $k$ 个点，且 $L_{v_1},L_{v_2},\cdots,L_k$ 是起点到各点的最短路径长度，则此时从 $Q$ 中依照算法再找一个点 $v_{k+1}$ ， $L_{k+1}$ 即为起点到 $v_{k+1}$ 的最短路径长度。
$用反证法：$
$假设L_{k+1}不是起点到v_{k+1}最短路径的长度$
$所以设起点到v_{k+1}的最短路径经过的点的集合为V，路径长度为L，则有L<L_{k+1}$
$\because 由L_k的含义\Rightarrow V\cap Q\neq\emptyset$
$又\because o\in V且o\in S \Rightarrow V \cap S \neq\emptyset$
$则设到v_{k+1}的最短路径中，最靠近v_{k+1}且不属于S的点为v_x，v_x的后继为v_y$
$\because 有向图中边均为正权边$
$\therefore 必有L_{v_x}<L_{v_y}\leqslant L，v_y为v_{k+1}时等号成立$
$又\because v_x\not\in S\Rightarrow L_{v_x}>L_{k+1}，产生矛盾$
$故假设不成立，子命题得证$

综上所述，该命题得证，故算法正确。

关于负权边

Dijkstra算法要求有向图中不得有负权边，如果图中有负权边，则在之前的证明过程中：

$∵ L v x < L v y 不一定成立（ L v y ⩽ L 依然成立）$ $\because L_{v_x}<L_{v_y}不一定成立（L_{v_y}\leqslant L依然成立）$
$∴ L v x > L k + 1 不一定成立$ $\therefore L_{v_x}>L_{k+1}不一定成立$
故此时算法正确性不得证。

这里举一个简单的例子供读者自行对照理解：

时间复杂度

设有向图中，共有 $V$ 个顶点， $E$ 条边。
传统Dijkstra算法中主要操作有：

每次从 $Q$ 集中找到 $L_k$ 最小的点，最坏情况下需：
$(V - 1), (V - 2), \dots, 1$ $(V-1),(V-2),\cdots,1$
次操作。
所以整个算法过程共需：
$(V - 1) + (V - 2) + \dots + 1 = ( v - 1 ) v 2 = V 2 2 - 1 2$ $(V-1)+(V-2)+\cdots+1=\frac{(v-1)v}{2}=\frac{V^2}{2}-\frac{1}{2}$
次操作。
计算并更新各点邻居的 $L_k$ 值，实质上是将所有的边遍历一遍，故需 $E$ 次操作。
则用大 $O$ 表示法:
$O (V 2 2 - 1 2 + E) \Leftrightarrow O (n 2)$ $O(\frac{V^2}{2}-\frac{1}{2}+E)\Leftrightarrow O(n^2)$
故传统Dijkstra算法的时间复杂度为 $O(n^2)$

Dijkstra算法的优化

在上述对于传统Dijkstra算法的时间复杂度分析中，我们可知，（尤其是稀疏图中）从 $Q$ 集中找到 $L_k$ 最小的点的过程极大影响了算法的性能，这个过程在顶点无序状态下需要 $O(n^2)$ 的复杂度。
因此对于顶点的有效排序可以大大地提高算法的性能，常用的方法有：小顶堆或优先队列：

小顶堆优化中，我们初始将所有顶点设置为一个小顶堆，此时堆顶一定为起点，而在每一次迭代中，我们将堆顶元素取出（复杂度 $O(1)$ ），而后调整小顶堆（复杂度 $O(logn)$ ），这样调整 $V$ 次，直到堆中所有顶点全部加入 $S$ 。则整个算法的时间复杂度将从 $O(n^2)$ 优化为 $O(nlogn)$ 。
优先队列优化中，建立一个最小优先的优先级队列，队列中保存顶点和当前 $L_k$ 值的二元组，初始将起点二元组入队，每当某个顶点的 $L_k$ 值被更新，则将这个新的顶点二元组入队，每次迭代时，将队首元素取出并出队，直到队列为空。由于优先队列一般采用堆实现，故维护优先队列的复杂度同为 $O(logn)$ ，则整个算法的时间复杂度同被优化为 $O(nlogn)$ 。

注意：优先队列优化中，新的顶点二元组入队时，旧的二元组依然在优先队列中，因此每次出队的元素可能会有杂音，如何识别并去除这些杂音是这种优化方式需要考虑的。

关于无向图

事实上，Dijkstra算法同样可以处理无向图中的单源最短路问题（无向图其实可看做一种特殊的有向图），但在这种情况下，要对算法做一些修改：标记已经访问过的边，在寻找邻居时不沿已标记过的边寻找。

关于空间复杂度

Dijkstra算法的空间复杂度视具体实现方法而定，采用邻接矩阵的存图方式的空间复杂度为 $O(n^2)$ ，然而在稀疏图中，这种存储方式将有大量的空间浪费，因此推荐使用邻接表和有关标志数组存图。

算法具体代码实现多种多样，留作读者自行思考，在此不再赘述。

绝对原创，转载请注明出处。
才疏学浅，如有错误，望不吝赐教