【算法证明七】深入理解深度优先搜索

树不懒

已于 2023-06-24 21:42:47 修改

阅读量580

点赞数

分类专栏：算法文章标签：深度优先算法

于 2023-06-24 21:37:07 首次发布

本文链接：https://blog.csdn.net/weixin_43233774/article/details/131351449

版权

算法专栏收录该内容

13 篇文章 0 订阅

订阅专栏

深度优先搜索包含一个递归，对其进行分析要复杂一些。与上一篇文章一样，还是给节点定义几个状态，然后详细分析深度优先搜索算法有哪些性质。

算法描述

定义状态

$v . co l or ：初始状态为白色，被发现时改为灰色，其所有的邻接节点遍历完成后，变为黑色。$
$v.\pi : v 的前驱节点，也就是说是从哪个节点发现 v 的，初始化为 n i l$
$v . d ：时间戳，表示节点第一次被发现的时间$
$v . f ：时间戳，表示完成对邻接节点扫描的时间$

DFS(G)
	for v in G.V
		v.color=white
		v.Π=nil
	time=0
	for v in G.V
		if v.color == white
			DFS-VISIT(G, v)

DFS-VISIT(G, v)
	time += 1;
	v.d = time
	v.color = grary
	for u in G.Adj[v]:
		if u.color = white:
			u.Π=v
			DFS-VISIT(G, u)
	v.color = black
	time += 1;
	v.f = time;

该算法的时间复杂度分析与广搜的分析类似，使用聚合分析，发现每个节点访问一次，每条边访问一次，总复杂度为 $O (V + E)$

深度优先搜索的性质

深度优先搜索提供了关于图结构价值很高的信息。
性质1：生成的前驱子图 $G.\pi$ 是由多颗树构成的森林。

$u=v.\pi$ ，当且仅当DFS-VISIT(G, v) 在对 u 节点邻接表搜索时被调用。
v 是节点 u的后代，当且仅当节点 v 在节点u 为灰色时被发现

性质2：括号化结构：对于某一个节点，u, 如果以’(u’表示节点u的发现，’u)'表示节点u的完成。则算法的运行过程会形成一个恰当嵌套的括号化结构。

定理1. 括号化定理：在对图G进行深度优先搜索时，任意两个节点v,u，下面三种情况只有一种成立

区间 $[u . d, u . f]$ 和区间 $[v . d, v . f]$ 完全分离， $v$ ， $u$ 之间没有后代关系。
区间 $[u . d, u . f]$ 在区间 $[v . d, v . f]$ 之内。在深度优先搜索树中， $u$ 是 $v$ 的后代
区间 $[v . d, v . f]$ 在区间 $[u . d, u . f]$ 之内。在深度优先搜索树中， $v$ 是 $u$ 的后代

证明：当 $\lt v.d$ 时，根据 $u . f$ 与 $v . d$ 的关系，可以分为两种情况
$\lt v.d$ 时，容易扩充得到不等式 $\lt u.f \lt v.d \lt v.f$ ，此时两区间分离，且没有一个节点是在另一个节点是灰色时被发现的，一次没有任何一个节点是另一个节点的后代
$\gt v.d$ ，说明节点 $v$ 在节点 $u$ 是灰色时被发现。意味着v 是u 的后代。此外，当算法返回来继续处理 $u$ 时， $v$ 节点已经处理完，因此区间 $[v . d, v . f]$ 在区间 $[u . d, u . f]$ 之内。证明完毕
推论：在深度优先树中， $v$ 是 $u$ 的后代，当且仅当 $\lt v.d \lt v.f \lt u.f$ 成立

定理2：白色路径定理。 $v$ 是 $u$ 的后代，当且仅当算法发现 $u$ 时，存在一条从 $u$ 到 $v$ 的全部由白色节点组成的路径。
证明： $v$ 是 $u$ 的后代时， $v$ 在 $u$ 之后被发现。发现 $u$ 时， $u$ 的后代此时均未被发现为白色，当然包括 $v$ 。所以可以顺着后代路径，找到一条达到 $v$ 的白色路径。
当发现 $u$ 时，存在一条从 $u$ 到 $v$ 的白色路径。意味着深度优先算法至少一定会完成 $v$ 的访问后，再回到 $u$ 。满足不等式， $\lt v.d \lt v.f \lt u.f$ 。符合定理1的后两条之一。因此充分性和必要性均得证。

性质3：边的分类

根据深度优先搜索森林 $G.\pi$ ，可以定义 4 种边类型。

树边： $G.\pi$ 中的边
后向边：当v是u的祖先时， $(u, v)$ 称为后向边
前向边：当v是u的祖先时， $(v, u)$ 称为前向边
横向边：其他的所有边。

深度优先搜索算法可以将图中的所有边进行分类：当探索边 $(v, u)$ 时

$u$ 是白色， $(v, u)$ 是树边
$u$ 是灰色， $(v, u)$ 是后向边
$u$ 是黑色， $(v, u)$ 是前向边或横向边
- 当 $u.d\lt v.d$ 时， $(v, u)$ 是前向边
- 当 $u.d\gt v.d$ 时， $(v, u)$ 是横向边

无向图的边类型按照符合的第一顺位分类。

定理3：无向图的边，要么是树边，要么是后向边。
证明：设 $(u, v)$ 时无向图的一条边。假设 $u . d < v . d$ ， $u$ 先被访问。 $v$ 在 $u$ 的邻接节点链表里。但算法第一次访问边 $(u, v)$ 时，仍然有两种可能：如果从 $v$ 访问 $u$ ，此时 $u$ 已经被发现， $(u, v)$ 是一条后向边。如果从 $u$ 访问 $v$ ， $v$ 一定是白色。因为如果是灰色或者黑色，那么 $(u, v)$ 一定已经从 $v$ 访问过了。因此 $(u, v)$ 此时是树边。

强连通分量

这应该是图论中第一个简单(只用到了深搜)有用，但是难想，不直观的算法了。
首先定义强连通分量：图G的强连通分量是一个最大的节点集合 $\subseteq G.V$ ，该集合中的任意两个节点之间都可以相互到达。下图中圈起来的节点，就是强连通分量

强连通分量示意

为了实现强连通分量算法，先讨论一下分量图： $G^{SCC} = (V^{SCC}, E^{SCC})$ 。定义如下：假如 G 由强连通分量 $C_1, C_2，..., C_k$ ，易知强连通分量之间并不相交。任意从分量中挑出代表节点 $v_1, v_2, ..., v_k$ 作为 $V^{SCC}$ 。如果对于两个节点 $x\in C_x, y\in C_y$ ，存在边 $(x, y)$ ，则边 $v_x, v_y)$ 在 $E^{SCC}$ 中。上面的分量图可以通过缩点变成分量图如下：
请添加图片描述

定理4 ：分量图是有向无环图：设 $C$ 和 $C^{'}$ 是两个不同的强连通分量，设 $u,v\in C$ , $u',v'\in C'$ 。如果存在一条边 $(u, u^{'})$ ，则必不存在边 $(v^{'}, v)$ 。
证明：如果存在边$(v’,v)，那么 $C, C^{'}$ 两个强连通分量里的节点便满足了强连通分量的定义， $C, C^{'}$ 应该合并成 1 个，而不是两个，矛盾。

为了不产生歧义，对节点的描述 $v . f$ 表示的都是对 $G$ 深度优先遍历的结果，而不是 $G^T$

定理5：(深度优先搜索的节点完成时间) ：设 $C$ 和 $C^{'}$ 是图 $G$ 的两个不同的强连通分量， $f (C)$ 表示强连通分量 $C$ 的节点 $v . f$ 的最大值, $d (C)$ 表示强连通分量 $C$ 的节点 $v . d$ 的最小值。如果存在一条边 $\in G.E$ 满足 $u\in C$ , $v\in C'$ ，那么 $f (C) > f (C^{'})$ .
证明：根据深度优先搜索中，最先发现的节点在 C 中还是 C’ 中进行讨论。

如果 $\lt d(C')$ ，那么深度优先搜索算法一定会通过边 $(u, v)$ 遍历完 $C^{'}$ 中的节点后，在回到 $C$ 中。因此 $f (C) > f (C^{'})$ .
如果 $\gt d(C')$ ，那么由于分量图是无环图，将无法通过 $C^{'}$ 到达 $C$ 中的任何一个节点。必然是算法返回 DFS 主循环后，再访问 $C$ 中的节点，此时仍有 $f (C) > f (C^{'})$ 证毕。

推论5.1：设 $C$ 和 $C^{'}$ 是图 $G$ 的两个不同的强连通分量，如果存在一条边 $\in G^T.E$ ，满足 $u,v\in C$ , $u',v'\in C'$ ，那么 $f (C) < f (C^{'})$ .
根据定理5 以及下图，本推论有较为直观的理解，不再证明。
请添加图片描述

强连通分量算法

strongly-connected-components(G)
	DFS(G) // 计算出 v.f
	compute GT // 计算转置图，节点列表按照 v.f 降序排列
	DFS(GT)
	print GT 的深度优先搜索森林。

定理6 强连通分量算法正确

证明：数学归纳法：归纳假设是算法第三行运行时，生成的前 k 棵树是强连通分量。初始情况 k = 0，显然成立。
假设前 $k$ 棵树是强连通分量，考虑第 $(k + 1)$ 棵树。树跟节点为 $u$ ， $u$ 位于强连通分量 $C$ 中。由于 $u$ 是根节点，对于除 $C$ 外的未被访问的任意强连通分量 $C^{'}$ ，有 $\gt f(C')$ 。根据归纳假设 $C$ 当前所有的节点都是白色。根据白色路径定理， $C$ 中的所有其他节点都是 $u$ 的后代。根据推论 5.1，任何从 C 出发的边，一定通向 $f(C^b)$ 更大连通分量 $C^b$ 。因此根据我们的遍历顺序，除 $C$ 内的节点外，不存在节点能够成为 $u$ 的后代。因此 $k + 1$ 棵树刚好形成一个强连通分量。归纳完毕。

可以从 $G^T$ 的分量图角度来看待第二次深度优先遍历。就相当于逆着 $G^T$ 的分量图的拓扑序来遍历，看上面的右图更直观。

给出求强连通分量的 C++ 代码做参考

int V;
vector<int> G[MAX_V];
vector<int> Gt[MAX_V];
vector<int> vs;
bool used[MAX_V];
int cmp[MAX_V]; // 表示 节点 v 所属强连通分量的拓扑序编号
void add_edge(int from, int to) {
	G[from].push_back(to);
	Gt[to].push_back(from);
}
void dfs(int v) {
	used[v] = true;
	for (int i = 0; i < G[v].size(); i++) {
		if (!used[G[v][i]) dfs(G[v][i]);
	}
	vs.push_back(v);
}
void rdfs(int v, int k) {
	used[v] = true;
	cmp[v] = k;
	for (int i = 0; i < Gt[v].size(); i++) {
		if (!used[v]) dfs(Gt[v][i])
	}
}

int scc() {
	memset(used, 0, sizeof(used));
	for (int v = 0; v < V; v++) {
		if(!used[v]) dfs(v);
	}
	memset(used, 0, sizeof(used));
	int k = 1;
	for (int v = V - 1; v >= 0; v--) {
		if(!used[vs[v]]) rdfs(vs[v], k++);
	}
	return k; // 表示有几组强连通分量
}

至此，应该可以说搞懂图的深度优先搜索了。