第3章：搜索与图论【AcWing】

Man9Oo

已于 2023-11-15 12:22:28 修改

阅读量2.3k

点赞数 3

分类专栏：算法基础文章标签：图论 BFS DFS 拓扑序列最短路最小生成树二分图

于 2023-11-14 23:28:35 首次发布

本文链接：https://blog.csdn.net/m0_63312733/article/details/134410250

版权

算法基础专栏收录该内容

3 篇文章

订阅专栏

文章目录

图的概念
图的存储方式
DFS
BFS
有向无环图的拓扑序列
最短路径问题
最小生成树
二分图

阅读前导

本文默认读者有数据结构和图论基础，本文是对图论的几个代表性算法的入门，虽然题目的解法比较朴素，但是比较好理解。

图的概念

首先简单复习一下离散数学中图论的相关概念。

图的概念

图是由顶点和边组成，顶点一般表示对象，边一般表示对象之间的关系。

在图论中，多个顶点或边组成的集合叫做顶点集（Vertices Set）或边集（Edges Set）。例如，图 G 可以写成 G= (V, E)，其中 V 是图 G 的顶点集，E 是图 G 的边集。

树是一种特殊的图。

图的分类

有向图和无向图

根据边是否有方向，可以将图分为有向图和无向图。

无向图：

有向图：

通常情况下，只对有向图进行讨论，因为无向图的每一条无向边相当于两条方向相反的有向边组成的。

连通性

无向图的连通性：如果无向图中任意两个顶点之间都有一条无向路径，则称该图为连通图。
有向图的连通性：如果有向图中任意两个顶点之间都有一条有向路径，则称该图为强连通图。如果将有向图的所有边替换成无向边后得到一个连通图，则称该有向图为弱连通图。

连通块

连通块是指无向图中的一个子图，它满足以下两个条件：

子图中的任意两个顶点都能通过路径相连，即可以沿着图中的边互相可达。
子图中的所有顶点都不和原图中的其他顶点连通，即子图是原图的一个独立部分。

当左边灰色区域中最右边的节点被移除时，这个图就变得不连通了：

当虚线边被移除时，这个图就会不连通：

有顶点 0，这个图就是非连通的。该图的其余部分是连通的：

重边和自环

重边是两条或多条与同一对顶点相连接的边。例如：

自环是一条顶点与自身连接的边。例如顶点 1：

稠密图和稀疏图

若一张图的边数远小于其点数的平方，那么它是一张稀疏图 (sparse graph)。

若一张图的边数接近其点数的平方，那么它是一张稠密图 (dense graph)。

区分稠密图和稀疏图的主要依据是看题目给的数据是否呈以上两种关系之一，这么做的原因是算法在稠密图和稀疏图中的效率不同。

参考资料

图的概念与存储方式|哔哩哔哩

图的存储方式

在计算机中，图的存储就是用数据结构来表示图的顶点集和边集的方法。根据图的稀疏或稠密，主要分为邻接表或邻接矩阵。

邻接表

用一个一维数组和一个链表来存储图中顶点和边的信息，一维数组中的每个元素对应一个顶点，每个元素指向一个链表，链表中存储与该顶点相邻的顶点或者边的权重（很像哈希桶）。邻接表适合表示稀疏图，即边数较少的图，空间复杂度为 $O (N + E)$ ，其中 $N$ 为顶点数， $E$ 为边数。

可以用链式前向星来存储邻接表。

无向图，链表记录的是顶点的邻居结点：

有向图，链表记录的是顶点的出度：

由于我们解决的问题主要是关于“路径长度”的问题，枚举每一条边，就是枚举每个顶点的出边。因此研究的单位应该是边，一条边需要两个点和一个边长来表示，分别用三个数组来存储：

head[]：存储每个顶点
ver[]：head[i] 这个点指向的终点
edge[]：head[i] 点指向 ver[i] 这条边的长度

除此之外，邻接表本身是一个链表，而链表的实现有几种，在算法题目中通常用占用内存较小的数组模拟逻辑上的链表。

next[]：记录边集数组的下标

以上面这个有向图为例，四个数组的关系是这样的：

在分析时，应该注意每个数组的含义，例如从 head[i] 这个顶点出发，到 ver[i] 这个边，边长为 edge[i]，下一个结点的位置是 next[i]。

代码

const N = 100010, M = N * 2; // 无向图需要两条有向边
int head[N], ver[M], edge[M], Next[M], idx;

// 插入一条从 x 到 y 长度为 z 的有向边
void add(int x, int y, int z)
{
    idx++;
    ver[idx] = y;
    edge[idx] = z;
    // 头插
    Next[idx] = head[x];
    head[x] = idx;
}

// 读入一条有向边
add(x, y, z);

// 读入一条无向边（一对有向边==一条无向边）
add(x, y, z);
add(y, x, z);

// 枚举从 x 顶点出发的所有边
for (int i = head[x]; i != 0; i = Next[i])
{
    // 能提供循环条件，则说明还有边
    int y = ver[i];
    int z = edge[i];
    // 后续操作
}

// 清零只需要处理链表和计数器
memset(head, 0, sizeof(head));
idx = 0;

邻接矩阵

用一个二维数组来存储图中顶点之间的关系，数组的行和列分别对应图中的顶点，数组的元素表示两个顶点之间是否有边或者边的权重。邻接矩阵适合表示稠密图，即边数较多的图，但是空间复杂度较高，为 $O (N^2)$ ，其中 $N$ 为顶点数。

在这个矩阵中，不论是有向图还是无向图，顶点到它本身的距离为 0。如果两个顶点不是直接连通的，那么规定距离为无穷 $\infty$ 。

无向图：矩阵记录每个顶点到它邻居结点的距离，关于对角线对称。

有向图：矩阵记录每个顶点的出度结点的距离。

二维矩阵的存储，只需要用一个二维数组a[i][j]表示从 i 指向 j 的一条边，这个二维下标对应的数组元素则为边的权重。

DFS

深度优先搜索（Depth-first search ，DFS）是一种图算法，它的基本思想是从一个顶点开始，沿着一条路径不断向前探索，直到不能再继续为止，然后回溯到上一个顶点，再从另一条路径继续探索，直到遍历完所有的顶点和边。

DFS 中的“深度”体现在它的搜索策略上，即优先选择未访问过的相邻顶点进行探索，形成一条尽可能长的路径（所谓“一条路走到黑，不撞南墙不回头”）。DFS 的思想天然地与递归契合，每次递归调用相当于向深处探索一层，每次返回相当于回溯一层。

File:Depth-First-Search.gif

对于 DFS，最重要的是“顺序”，即用何种顺序把所有情况遍历一次。由于 DFS 的特点，每一个 DFS 路径都对应着一颗搜索树，什么意思呢？就是说 DFS 在走到不能走的时候，就说明此时已经找到了一个结果（具体这个结果正确与否，取决于问题对这个结果的限制）。

全排列问题

题目描述

按照字典序输出自然数 $1$ 到 $n$ 所有不重复的排列，即 $n$ 的全排列，要求所产生的任一数字序列中不允许出现重复的数字。

输入格式

一个整数 $n$ 。

输出格式

由 $\sim n$ 组成的所有不重复的数字序列，每行一个序列。

每个数字保留 $5$ 个场宽。

样例输入

样例输出

1    2    3
1    3    2
2    1    3
2    3    1
3    1    2
3    2    1

提示

$\leq n \leq 9$ 。

思路

如果只问你 1/2/3 这三个数字最多能有多少种排列方式，相信你会很快得到答案：3*2*1=6，这个算法的本质是枚举每一个位置上，能够取哪些数字。例如个位数能取到 1/2/3，那么十位数只能取到其中两个数字，百位数只能取一个数字。

这和朴素的递归思想是类似的，因为递归执行的是同一种操作，只是它的规模在不断缩小，当规模缩小到不能再小时，就“撞到南墙”了，也就得到一个结果了。

首先用一个递归树来演示 DFS 的过程：

初始状态是三个空位置，第一位有 3 种填法，第二位有 2 种填法，因为不能和第一位相同，第三位只有一种填法。

视角：在每一层中，递归应该看的是下一层还能填什么数字，如果没得填了，就说明走到最后了。

回溯

当得到一个结果时，相当于这条分支已经被使用过了，但是从这递归树来看，它的父结点的另一个孩子可能还未使用（即当前结点的兄弟结点），所以要回溯到上一层，以还原“现场”。

因为要回溯，所以我们需要用栈来保存当前结点的父结点在递归树中的位置，不过递归天然地使用了系统中函数栈帧，所以递归调用的返回就是一次回溯。

标记

为了保证能够一次性枚举图中的所有元素，当得到结果的同时为这个叶子结点打上标记。这应该在回溯之前完成。

剪枝

在 DFS 中，不一定所有结果都是符合题目要求的，例如在递归的过程中，第二个数字和第一个数字相同，那么此时就可以直接返回，此路径作废，以此提高效率，这就是剪枝。

代码

数据结构：

path[]存储递归树中，从根结点到叶子结点的路径，也就是保存一个结果，以供打印。（如果只问结果的个数，可以不需要它）
visited[]存储 path 这条路径中，已经访问过的结点。

注意，visited[i] 这个标记当回溯时也要被还原，因为回溯的前提是上一次递归返回了。结合递归树理解，为什么要标记呢？因为递归的下一层仍然是一个类似的递归树。递归从 x 结点进入下一层时，x 结点对于本次递归就算是访问过了，当跳出此次递归后，还得访问另一边的子树，所以恢复 x 结点的状态，以通过进入递归的判断条件。

递归终止条件：当计数器和数字的长度相等时，即得结果，打印路径。

#include <iostream>
using namespace std;

const int N = 100010;
int path[N];
bool visited[N];
int n;

void dfs(int x)
{
    // 当填满时，打印
	if (x == n)
	{
		for (int i = 0; i < n; i++) printf("    %d", path[i]);
		printf("\n");
		return;
	}
	for (int i = 1; i <= n; i++)
	{
        // 如果这个结点还没有被访问过
		if (visited[i] != true)
		{
			path[x] = i; // 记录到路径中
			visited[i] = true; // 标记它被使用过
			dfs(x + 1); // 递归下一层
			visited[i] = false; // 递归返回后才能走到这一步，回溯还原现场
		}
	}
}

int main()
{
	while (cin >> n)
	{
		dfs(0); // 注意从第 0 个元素开始
	}
	return 0;
}

递归必须从第 0 个格子开始，其次是这个例子的剪枝体现的不明显，在下面的例子中会有比较深刻的体会。

时间复杂度

这个 DFS 的思路的时间复杂度是 $O (n!)$ ，因为它要枚举每一行的每一列，然后检查是否满足条件。如果满足条件，就继续递归下一行。如果不满足条件，就回溯到上一行。这样的过程相当于在 $n$ 个数中选出 $n$ 个数的全排列。

N 皇后问题

题目描述

一个如下的 $\times 6$ 的跳棋棋盘，有六个棋子被放置在棋盘上，使得每行、每列有且只有一个，每条对角线（包括两条主对角线的所有平行线）上至多有一个棋子。

上面的布局可以用序列 $2\ 4\ 6\ 1\ 3\ 5$ 来描述，第 $i$ 个数字表示在第 $i$ 行的相应位置有一个棋子，如下：

行号 $1\ 2\ 3\ 4\ 5\ 6$

列号 $2\ 4\ 6\ 1\ 3\ 5$

这只是棋子放置的一个解。请编一个程序找出所有棋子放置的解。
并把它们以上面的序列方法输出，解按字典顺序排列。
请输出前 $3$ 个解。最后一行是解的总个数。

输入格式

一行一个正整数 $n$ ，表示棋盘是 $\times n$ 大小的。

输出格式

前三行为前三个解，每个解的两个数字之间用一个空格隔开。第四行只有一个数字，表示解的总数。

样例

样例输入

样例输出

2 4 6 1 3 5
3 6 2 5 1 4
4 1 5 2 6 3
4

对于 $100\%$ 的数据， $\le n \le 13$ 。

全排列思路 $O (n!)$

八皇后在每行每列，还有两条对角线中只允许一个皇后棋子存在，那么我们可以枚举每一列皇后的位置，只要满足条件就可以进入递归。

增加的逻辑是，八皇后不仅限制同行同列，还限制两条对角线。由于枚举的是每行的情况，那么就用一个数组col[]记录列格子的状态，用dg[[]和antidg[]来保存对角线（Diagonal）和反对角线（Antidiagonal）格子的状态。

代码

#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;

const int N = 20;
int n;
bool col[N], dg[N], antidg[N];
int path[N];
vector<vector<int>> ans; // 用一个二维数组来保存所有的解

// 枚举每一行，x 表示一列中第 x 格
void dfs(int x)
{
	if (x == n) 
	{
		ans.push_back(vector<int>(path, path + n)); // 把当前解放入数组中
		return;
	}
	// 枚举 x 格所在行的这一列
	for (int i = 0; i < n; i++)
	{
		// 如果 x 格在它所在列/对角线/反对角线都没有被访问过
		if (col[i] != true && dg[x + i] != true && antidg[n - x + i] != true)
		{
			path[x] = i; // 记录到路径中
			col[i] = dg[x + i] = antidg[n - x + i] = true; // 标记
			dfs(x + 1); // 进入递归
			col[i] = dg[x + i] = antidg[n - x + i] =  false; // 回溯 
		}
	}
}

int main()
{
	cin >> n;
	dfs(0);
	sort(ans.begin(), ans.end()); // 对所有的解进行排序
	for (int i = 0; i < min(3, (int)ans.size()); i++) // 输出前三个解，或者所有的解（如果小于三个）
	{
		for (int j = 0; j < n; j++)
		{
			printf("%d ", ans[i][j] + 1);
		}
		cout << endl;
	}
	cout << ans.size() << endl;
	return 0;
}

枚举思路 $O (n!)$

上面的思路是枚举每一行中的每个列的格子，下面的思路是直接枚举每一个格子，是比较朴素的思路。

对于每一个格子，有两种选择：选或不选。那么每一个格子都会分为两个分支，形成一棵递归树。

对于每个格子：

不放皇后：直接递归到下一个格子
放皇后：
1. 这个格子所在的行和列以及两个对角线不能有皇后存在
2. 更新状态：记录此行此列和两个对角线上已经有皇后了
3. 递归到下一个格子
4. 跳出递归，回溯恢复现场

注意，在枚举每个格子时，需要注意数组越界的问题，也就是当每一行走完后，就必须让它走到下一行的第一个位置了。

终止条件：这个朴素的思路是枚举每个格子，那么终止条件就是当找到所有符合条件的皇后时即得到一个结果。

代码

#include <iostream>
#include <vector>
#include <algorithm>
#include <cstring>
using namespace std;

const int N = 20;
int n;
bool row[N], col[N], dg[N], antidg[N];
int path[N][N];
vector<vector<int>> ans;

// 将当前放置的皇后位置保存到结果中
void saveResult()
{
	vector<int> queenPos;
	for (int i = 0; i < n; i++)
	{
		for (int j = 0; j < n; j++)
		{
			if (path[i][j] == 1)
			{
				queenPos.push_back(j);
				break;
			}
		}
	}
	ans.push_back(queenPos);
}

// 枚举每一个格子，坐标是 (x, y), count 表示已经放下的皇后数量
void dfs(int x, int y, int count)
{
	if (y == n)
	{		   // 当此行走到最后一个格子
		y = 0; // 让 y 回到最左
		x++;   // 让 x 走到下一行
	}

	if (x == n)
	{					  // 当走到最后一行
		if (count == n)	  // 所有皇后都被放下
			saveResult(); // 将结果保存到 ans 中
		return;
	}

	// 不放皇后
	dfs(x, y + 1, count);
	// 放皇后
	if (row[x] != true && col[y] != true && dg[x + y] != true && antidg[x - y + n] != true)
	{
		path[x][y] = 1;											 // 记录到路径中
		row[x] = col[y] = dg[x + y] = antidg[x - y + n] = true;	 // 标记
		dfs(x, y + 1, count + 1);								 // 进入递归
		path[x][y] = 0;											 // 回溯，撤销放置的皇后
		row[x] = col[y] = dg[x + y] = antidg[x - y + n] = false; // 回溯，撤销标记
	}
}

int main()
{
	cin >> n;
	memset(path, 0, sizeof(path));
	dfs(0, 0, 0);
	sort(ans.begin(), ans.end());					  
	for (int i = 0; i < min(3, (int)ans.size()); i++) 
	{
		for (int j = 0; j < n; j++)
		{
			printf("%d ", ans[i][j] + 1);
		}
		cout << endl;
	}
	cout << ans.size() << endl;

	return 0;
}

[注] 这段代码是最原始的版本，是比较好理解的，但是在处理大规模数据时（OJ）可能会超时，这是因为代码中存在一些不必要的操作。例如，在每次递归调用时都会检查所有的行和列，这实际上是不必要的，因为已经知道这一格在哪一行和哪一列。

此外，在保存结果时，遍历了整个棋盘来找到皇后的位置，这也增加了额外的计算量。实际上，可以在放置皇后时就记录下皇后的位置，这样在保存结果时就不需要再次遍历棋盘。

下面是优化后的版本：

const int N = 20;
int n;
bool col[N], dg[2 * N], udg[2 * N];
int path[N];
vector<vector<int>> ans;

// 将当前放置的皇后位置保存到结果中
void saveResult()
{
	vector<int> queenPos(path, path + n);
	ans.push_back(queenPos);
}

// 枚举每一个格子，坐标是 (x, y), count 表示已经放下的皇后数量
void dfs(int x)
{
	if (x == n)
	{
		saveResult(); // 将结果保存到 ans 中
		return;
	}

	for (int y = 0; y < n; y++)
	{
		if (!col[y] && !dg[x + y] && !udg[x - y + n])
		{
			path[x] = y;
			col[y] = dg[x + y] = udg[x - y + n] = true;
			dfs(x + 1);
			col[y] = dg[x + y] = udg[x - y + n] = false;
		}
	}
}

在最坏的情况下，需要尝试所有的放置方式，所以这两段代码的时间复杂度是 $O (n!)$ 。但是枚举思路在平均效率上还是比全排列思路低的。

树的重心

题目描述

给定一颗树，树中有 $n$ 个节点（编号 $1 \sim n$ ）。请你找到树的重心，并输出树的重心的节点编号。

重心定义：重心是指树中的一个节点，如果将这个点删除后，剩余各个连通块中点数的最大值最小，那么这个节点被称为树的重心。

如下图所示的树的重心为 1 号节点。

输入

第 1 行读入一个整数 n，代表树的节点的数量（ $1≤n≤10^5$ ）；

接下来 $n - 1$ 行，每行读入两个整数 $x$ 和 $y$ ，表示节点 $x$ 和 $y$ 之间有一条边（注意：不确定 $x$ 和 $y$ 的父子关系）。

输出

请输出树的重心的节点编号，如果树有多个重心，请按照编号从小到大依次输出，数字之间用空格隔开。

输入样例

输出样例

思路 $O (n)$

为了找到树的重心（centroid），我们需要知道每个节点的子树大小，即以该节点为根的子树包含的节点数。这个值可以通过（一次）DFS 来求出。

枚举每个节点，记录下如果删除这个节点后，剩余连通块的点数最大值
- 如何求某个连通块的点数？––通过对某个子树的根节点做 DFS
在这些最大值中找到最小值，然后根据最小值找到对应的节点

举个例子：

现在问题来了，这样需要对每个结点都要做一次 DFS，那么时间复杂度是 $O(n^2)$ 的，为了简化，需要使用到下面的结论。

通过图示中连通块数量之间的关系，我们可以总结出以下规律（树中的连通块也是树）：

某一子树的节点数量 subNum[i]，等于它的子树节点数量之和。
某一子树的节点数量 subNum[i]，等于整棵树的节点数减去除了这棵子树外的其他所有节点之和。这是因为树是一个连通无环的图，所以任意两个节点之间有且仅有一条路径，因此每个节点都只属于一个子树。

下面对这两点举个例子：

利用这样的结论，我们只需要 DFS 一次就能找到所有节点的子树大小，就这个例子而言，DFS 得到结果的刚开始顺序是自上而下的，然后再向上返回递归：

向下的过程我们是可以理解的，就是通过递归来统计某一棵子树的大小；
但是当向上递归时，DFS 目前只求出了下边的子树大小，那么就通过上面的结论来求出向上递归过程时的子树大小。这样就不用再对上面的节点再各来一次 DFS 了。

每个子树的点数将被存储在 subNum[] 数组中，以便复用，入口可以是任意的。可以从任意一个节点开始，是因为树是一个连通无环的图，所以每个节点都可以作为根节点，不影响树的结构。无论从哪个节点开始，都可以遍历到树的所有节点，计算出每个节点的子树大小。只是从不同的节点开始，可能会导致不同的遍历顺序，但是最终的结果是一样的。

代码

总之，要找到树的重心，首先要知道每个子树的大小，为了减少时间复杂度，那么就要用到「不论树的连通块（的数目或大小）如何变化，整体节点数不变」这个结论，这样就能在 DFS 递归的同时计算出所有子树的大小。

 #include <iostream>
#include <cstring>
#include <algorithm>
#include <vector>
using namespace std;

const int N = 100010, M = N * 2;

int n;
int head[N], ver[M], Next[M], idx;
bool visited[N];

int centroidVal = N; // 重心的值
int subNum[N]; // 保存每个节点最大子树的个数
vector<int> centroids; // 用一个向量来存储所有的重心
void add(int x, int y)
{
	idx++;
	ver[idx] = y;
	Next[idx] = head[x];
	head[x] = idx;
}

int dfs(int x)
{
	visited[x] = true; // 标记 x 点已经被访问过
	// sum 用来保存 x 子树的大小（默认包含它本身）, subMax 用来保存当删除节点 x 后，剩下较大的孩子子树的大小
	int sum = 1, subMax = 0; 
	for (int i = head[x]; i != -1; i = Next[i]) // 遍历 x 的孩子
	{
		int j = ver[i], subNum;
		if (visited[j] != true) // 如果当前节点没有被访问过
		{ 
			subNum = dfs(j); // 对它进行 DFS, 并且取出这棵子树的大小
			subMax = max(subMax, subNum); // 当删除当前节点 x 后，保存较大的那个孩子子树的大小
			sum += subNum; // 更新 x 的孩子数量
		}
	}
	// 每个节点只会执行一次
	subMax = max(subMax, n - sum); // 求出当删除节点 x 后，剩下最大连通块的大小
	centroidVal = min(centroidVal, subMax); //  重心的值更新为{每个节点的最大连通块的大小}这个集合中的最小值
	subNum[x] = subMax; // 记录 x 的最大子树大小
	
	return sum; // 返回 x 的父节点，告诉它 x 这棵子树的大小
}

int main()
{
	cin >> n;
	memset(head, -1, sizeof(head));
	memset(visited, false, sizeof(visited));
	for (int i = 0; i < n - 1; i++)
	{
		int a = 0, b = 0;
		cin >> a >> b;
		add(a, b);
		add(b, a);
	}
	if (n == 1) // 处理 n 为 1 的特殊情况
	{
		// cout << 1 << endl;
		cout << 1 << endl;
		return 0;
	}
	dfs(1); // 入口可以任意
	// cout << centroidVal << endl; // 输出重心的值
	for (int i = 1; i <= n; i++)
	{
		if (subNum[i] == centroidVal) // 如果 i 的最大子树大小等于重心的值
		{
			centroids.push_back(i); // 将 i 加入到重心的向量中
		}
	}
	for (int i = 0; i < centroids.size(); i++) // 输出所有的重心
	{
		cout << centroids[i] << endl;
	}
	return 0;
}

注意：

需要考虑到树的重心可能有两个的情况，用一个数组或向量来存储所有的重心，然后在最后输出它们。
处理树的大小为 1 的特殊情况，这时候重心的值应该为 1，可以在 dfs 之前判断一下 n 是否为 1，如果是的话，直接输出 1 即可。

这个思路的时间复杂度是 $O (n)$ ，其中 $n$ 是树的节点数。在遍历的过程中，每个节点只会被访问一次，每条边也只会被访问两次（一次正向，一次反向）。

[补充]

关于树的重心的一些结论：

如果以某个节点为整棵树（n 个节点）的重心，它的每棵子树的大小都小于等于 n/2。
重心到其他节点的距离和最小，如果有两个重心，那么距离和相同。
一棵树添加或删除一个节点，树的重心最多只移动一条边的位置。
把两棵树通过某个点相连，那么新树的重心必定存在于这条相连的路径上。

参考资料

BFS

广度优先搜索（Breadth-First Search，BFS）和 DFS 一样，也是一种图搜索算法。它的思想是从一个顶点开始，访问它的所有相邻顶点，然后再依次访问这些相邻顶点的相邻顶点，直到访问完所有的顶点。

BFS 可以用来寻找图中的最短路径、连通分量、拓扑排序等问题。它使用一个队列来存储待访问的顶点，每次从队列中取出一个顶点，访问它，并将它的未访问过的相邻顶点入队，直到队列为空。

这和 DFS 不同，DFS 使用的是系统维护的函数栈帧，通过递归建立；而 BFS 需要自己维护一个队列。

对于一棵二叉树而言，BFS 就是层序遍历，下一次搜索的范围就是在原有的基础上扩大一个单位的长度。

二叉树的层序遍历

给你二叉树的根节点 root ，返回其节点值的层序遍历。（即逐层地，从左到右访问所有节点）。

示例 1：

输入：root = [3,9,20,null,null,15,7]
输出：[[3],[9,20],[15,7]]

示例 2：

输入：root = [1]
输出：[[1]]

示例 3：

输入：root = []
输出：[]

思路 $O (n)$

由于 BFS 每次只会对与当前节点距离为 1 的节点进行扩展，所以 BFS 遍历树的结果，也就是树的层序遍历。

但是需要注意的是，BFS 的队列中在某一刻得到的序列，并不一定都在同一层，假如第二层的最后一个节点 X 还没有出队列，下一层的节点就已经进队列了，所以原生的 BFS 会有「元素分层」的现象。

树的层序遍历，使得我们需要增加一些限制，使得队列中如果有元素，那么它们在树中一定是同一层的。办法是：在遍历当前层的元素时，先把这一层元素的数量（即队列大小）保存下来，因为 BFS 每访问一个元素时，都会将它出队列，那么队列的大小是在不断变化的。

代码

class Solution {
public:
    vector<vector<int>> levelOrder(TreeNode* root) {
        vector<vector<int>> res;
        if (root == nullptr) return res;
        queue<TreeNode*> q;

        q.push(root);
        while (!q.empty())
        {
            vector<int> curLevel; // 记录当前层的元素值
            int n = q.size(); // 注意队列的大小必须在操作它之前保存，才能完整地遍历下一层的所有结点
            for (int i = 0; i < n; i++)
            {
                TreeNode* node = q.front();
                q.pop();

                curLevel.push_back(node->val);
                if (node->left) q.push(node->left);
                if (node->right) q.push(node->right);
            }
            res.push_back(curLevel);
        }
        return res;
    }
};

这个思路的时间复杂度是 $O (n)$ ，其中 $n$ 是树节点的个数。

参考资料

以上图片源自此题的题解：BFS 的使用场景总结：层序遍历、最短路径问题

BFS 的入门，同时也是此题解的视频解析：【111 广搜宽搜 (BFS) 算法】

走迷宫

给定一个 $n * m$ 的二维整数数组，用来表示一个迷宫，数组中只包含 0 或 1，其中 0 表示可以走的路，1 表示不可通过的墙壁。

最初，有一个人位于左上角 (1, 1) 处，已知该人每次可以向上、下、左、右任意一个方向移动一个位置。

请问，该人从左上角移动至右下角 (n, m) 处，至少需要移动多少次。

数据保证 (1, 1) 处和 (n, m) 处的数字为 0，且一定至少存在一条通路。

输入格式

第一行包含两个整数 n 和 m。

接下来 n 行，每行包含 m 个整数（0 或 1），表示完整的二维数组迷宫。

输出格式

输出一个整数，表示从左上角移动至右下角的最少移动次数。

数据范围

$1 \leq n, m \leq 100$

样例
输入样例：

输出样例：

思路 $O (nm)$

初始化队列：们需要一个队列来存储待处理的节点，将起始点放入队列中。
处理队列中的节点：处理队列中的节点。对于队列中的每一个节点，都要检查它的四个方向（左、上、右、下）。如果某个方向上的节点是可达的（即值为 1），并且没有被访问过，那么就将其加入到队列中，并标记该节点为已访问。
记录路径：为了能够找到从起始点到终点的路径，需要在每个节点中记录从起始点到当前节点的路径。使用一个二维数组 path 来存储路径信息，其中 path[i][j] 表示从起始点到点 (i, j) 的路径。
找到终点：当从队列中取出终点时，就表示已经找到了一条从起始点到终点的路径，可以直接从 path 数组中获取并输出这条路径。
处理所有路径：由于题目要求输出所有可能的路径，所以不能在找到第一条路径后就停止搜索。而是需要继续处理队列中的其他节点，直到队列为空。
无法到达终点：如果队列为空，但此时还没有找到终点，说明从起始点无法到达终点，输出 -1。

下面是得到这个样例输出的过程（图中省略了部分扩展方向，例如只有左和下，实际上需要有四个方向，荧光绿表示它是未被使用并且可以走的，但是此次查找不走它）：

在搜索的过程中，要用队列维护元素的状态：

入队：表示排队等待扩展
出队：扩展出队元素的邻居结点

数据结构：

用一个队列保存将要扩展的结点，这个结点应该是由上一个结点扩展决定的，默认是起点
用数组gra[][]来读取地图
用数组dis[x][y]来表示 (x, y) 这个点距离原点的距离

通过对 (x, y) 坐标的加减操作，实现对这个点周围的四个点的访问，可以用两个数组分别保存对 x 和 y 坐标的变换距离：x[4] = {-1, 0, 1, 0} 和 y[4] = {0, 1, 0, -1}，注意它们是组合使用的，例如要访问 (x, y) 点的左边那个点，那么就需要这么做：matrix[i + x[2] ][j + y[2] ] == matrix[i + 1][y + 0]。

如果要输出路径，可以用Prev[][]来保存路径（小写的 prev 可能会和头文件中的变量冲突），它保存的是当前节点的上一个节点。

代码

#include <iostream>
#include <cstring>
#include <queue>

using namespace std;

const int N = 110;

queue<pair<int, int>> q;
int n, m;
int gra[N][N];
int dis[N][N]; // 记录某点到原点的距离
pair<int, int> Prev[N][N]; // 记录当前元素的上一个结点

void printPath()
{
    int x = n - 1;
    int y = m - 1;
    while (x != 0 || y != 0)
    {
        printf ("%d %d\n", x, y);
        auto t = Prev[x][y];
        x = t.first;
        y = t.second;
    }
}

int bfs()
{
    int dx[4] = {-1, 0, 1, 0};
    int dy[4] = {0, 1, 0, -1};
    memset(dis, -1, sizeof(dis));

    dis[0][0] = 0; // 初始化距离
    q.push({0, 0}); // 将起点入队
    while (!q.empty())
    {
        auto t = q.front(); // 取出队头元素 t
        q.pop(); // 出队
        for (int i = 0; i < 4; i++) // 访问 t 的 4 个邻居
        {
            int x = t.first + dx[i], y = t.second + dy[i];
            // 如果坐标合法且不是墙，并且没有被访问过，则入队
            if ((x >= 0 && x < n && y >= 0 && y < m) && gra[x][y] == 0 && dis[x][y] == -1)
            {
                // path[x][y] = t; // 记录路径
                dis[x][y] = dis[t.first][t.second] + 1;
                Prev[x][y] = t; // 记录上一个合法的元素
                q.push({x, y});
            }
        }
    }

    // 打印
    printPath();

    return dis[n - 1][m - 1];
}

int main()
{
    cin >> n >> m;
    for (int i = 0; i < n; i++)
        for (int j = 0; j < m; j++)
            scanf("%d", &gra[i][j]);
    cout << bfs() << endl;
    return 0;
}

空间复杂度：这段代码需要存储迷宫本身，距离数组，前驱数组，和队列。迷宫本身，距离数组，和前驱数组都占用 $O (nm)$ 的空间，队列的最大长度为 $O (nm)$ （最坏情况下，所有的点都入队一次）。
时间复杂度为 $O (nm)$ ：这段代码需要遍历迷宫中的所有点，每个点最多被访问一次，每次访问需要 $O (1)$ 的时间。另外，每个点最多有四个邻居，每次访问邻居需要 $O (1)$ 的时间。

有向无环图的拓扑序列

有向无环图

在图论中，如果一个有向图从任意顶点出发无法经过若干条边回到该点，则这个图是一个有向无环图（DAG，Directed Acyclic Graph）。––有向无环图|维基百科

图片来源––图的拓扑排序|掘金

在一个有向图中，一个顶点的**「出度」指的是由该顶点指出的边的总数；一个顶点的「入度」**为指向该顶点的边的总数。

拓扑序列

拓扑排序是一种对有向无环图（DAG）中的所有顶点进行线性排序的方法，使得对于任意一条有向边 (u,v)，顶点 u 都排在顶点 v 的前面。拓扑排序可以用来表示一些有依赖关系的任务的执行顺序，例如课程的选修顺序。

以一个生活中的例子理解拓扑排序，在大学中的第一年我们学习的课程都是通识课，例如高等数学，概率论和线性代数等。只有学了这些前导课程，才有可能学习后续的专业课。也就是说，我们在不同阶段学习的课程是有先后顺序、依赖关系的。这也是有向图才会有拓扑序列的原因。

例如学习本科算法的前导课程（不考虑 C 语言）是高等数学->概率论->数据结构，那么当学习高等数学时，它是没有前导课程的，所以我们可以直接学习它；当学习完高等数学以后，对于概率论而言，我们已经学习了它的前导课程，那么我们也可以直接开始学习概率论。… 因此，在一个合法的拓扑序列中，对于每一个当前元素而言，它的所有依赖元素我们都已经访问过，也就是它的入度为 0，即它无需依赖任何元素。如果遍历了图中每个元素都符合这一规则，那么这就是这个 DAG 的一种合法的拓扑序列。

BFS 思路 $O (n + m)$

Kahn 算法是一种基于广度优先搜索（BFS）的拓扑排序算法，它的切入点是拓扑序列的定义，即一个元素的入度，表示了它的依赖关系。BFS 的思想是枚举所有可能，其实也是一种不断假设并尝试的过程：BFS 能够一次遍历图中所有元素，同时能够假设当前元素在何种条件下是复合某种规则的。那么元素的出度拿来做什么呢？––出度是对于当前元素而言的，它用来寻找这个元素后面的元素。

数据结构：

二维数组ver[x][y]：存储 x 元素的下一个邻居，即（x, y）/（x->y）这条有向边。
数组in[x]：存储 x 元素的入度
数组topo[]：存储当前合法的拓扑序列
[算法核心] 队列q：维护一个入度为 0 的元素的集合

算法流程：

枚举图中每个顶点，把所有入度为 0 的顶点添加到队列q中。
当队列q不为空时：
1. 在队列q中任取一个顶点 x（一般为了方便，取队头），将 x 添加到到数组topo[]中
2. 将顶点 x 的所有出边（x->y）删除，即删除边 (x, y)，那么顶点 y 的入度就为 0，将 y 入队q
循环结束，队列为空
如果数组topo[]的有效元素个数为 n，那么说明所有元素都执行了上述步骤，也就是说每个顶点都可以作为入度为 0 的点压入队列q中，所以这是一个合法的拓扑序列；否则说明图中存在环。

以一个简单的例子演示算法流程：

假如图中有环：

注意，拓扑序列是不唯一的，这取决于每次从队列取出元素的顺序。

代码

#include <iostream>
#include <queue>
using namespace std;

const int N = 100010;
int n, m;
int in[N];
vector<int> ver[N], topo;

bool TopoSort()
{
	queue<int> q;
	// 将所有入度为 0 的顶点入队
	for (int i = 1; i <= n; i++)
		if (in[i] == 0) q.push(i);

	while (!q.empty())
	{
		// 取出队头元素 x（理论上可以取队列中任意元素）
		int x = q.front();
		q.pop();
		topo.push_back(x);
		// 将 x 顶点的出边 (x, y) 全部删除
		// 当 y 顶点的入度为 0, 则入队
		for (auto &y : ver[x])
			if (--in[y] == 0) q.push(y);
	}

	return topo.size() == n;
}

int main()
{
	// 读入顶点数 n,m 行数据
	cin >> n >> m;
	for (int i = 0; i < m; i++)
	{
		int a, b;
		cin >> a >> b;
		// 读取 (a, b) 有向边，b 的入度则+1
		ver[a].push_back(b);
		in[b]++;
	}
	if (!TopoSort()) puts("-1");
	else for (auto &e : topo) printf("%d ", e);

	return 0;
}

注意：

ver 是一个二维数组，它存储的是 x->y 有向边，当读入这条边时，y 顶点的入度要加 1。
拓扑序列不是唯一的，在一些 OJ 为了答案的一致性，要求取出队列中编号较小的那一个，这就需要用一个优先队列或栈来维护这个队列中的最大或最小值了。
如果图中存在孤立点，那么说明它是没有依赖某个顶点的，所以它可以出现在拓扑序列的任意位置。在这个写法中，算法的第一步就将所有入度为零的顶点入队，包括孤立点。

这个算法的时间复杂度是 $O (n + m)$ ，其中 $n$ 是顶点数， $m$ 是边数。：

遍历所有顶点，计算每个顶点的入度，并将入度为 0 的顶点入队。这一步的时间复杂度是 $O (n + m)$ ，
不断从队列中取出一个顶点，将其加入拓扑序列，并将其所有出边删除，即将其相邻顶点的入度减 1，并将入度变为 0 的顶点入队。这一步的时间复杂度是 $O (n + m)$ ，因为每个顶点和每条边都只被访问一次。

参考资料

最短路径问题

最短路径问题是对于含有边权的图而言的，主要分为以下几种，分类的根据是已知的起点和终点的数量：

确定起点的最短路径问题，也叫单源最短路问题，即已知一个起点，求到其他所有点的最短路径。
- 边权为正：
  - 朴素 Dijkstra 算法， $O(n^2)$
  - 堆优化 Dijkstra 算法， $O (m l o g n)$
- 存在负权边：
  - Bellman-Ford 算法， $O (nm)$
  - SPFA 算法，一般 $O (m)$ ，最坏 $O (nm)$
它们的基本思想是动态规划/贪心思想，即利用已知的最短路径信息更新其他点的最短路径。
全局最短路径问题，也叫多源最短路问题，即求图中任意两点之间的最短路径。
- Floyd-Warshall 算法等方法解决。
它的基本思想是逐步扩展中间点的集合，更新两点之间的最短路径。

值得注意的是，在学习图论时经常会使用到贪心思想和动态规划，问题在于证明它们的正确性（尤其是贪心）不是一件容易的事，所以希望读者在初学过程中能够通过一定数量的经典案例来体会这两种思想适用于何种问题。

贪心和动态规划这两种思想，在某些问题中往往难以明确地划分它们的区别，但是它们的着眼点有所不同：贪心关注问题的局部最优，每一步都是最优的，那么结果也是最优的（如果贪心是正确的话）；动态规划虽然操作的是局部，但是关心的是整体，它不会漏掉任何一种情况，而贪心可能会因为局部选择最优而漏掉一些情况。

单源最短路径问题

在单源最短路径问题（Single Source Shortest Path）中，给定一张有向图 $G = (V, E)$ 。 $V$ 是点集， $E$ 是边集， $∣ V ∣ = n$ ， $∣ E ∣ = m$ ，节点以 $[1, n]$ 之间的连续整数编号， $(x, y, z)$ 描述一条从 $x$ 出发，到达 $y$ ，权值/长度为 $z$ 的有向边。设 $1$ 号点位起点，求长度为 $n$ 的数组 $d i s t []$ ，其中 $d i s t [i]$ 表示从起点 $1$ 到节点 $i$ 的最短路径长度。––算法竞赛进阶指南

题目描述

给定一个 $n$ 个点， $m$ 条有向边的带非负权图，请你计算从 $s$ 出发，到每个点的距离。

数据保证你能从 $s$ 出发到任意点。

输入格式

第一行为三个正整数 $n, m, s$ 。
第二行起 $m$ 行，每行三个非负整数 $u_i, v_i, w_i$ ，表示从 $u_i$ 到 $v_i$ 有一条权值为 $w_i$ 的有向边。

输出格式

输出一行 $n$ 个空格分隔的非负整数，表示 $s$ 到每个点的距离。

样例输入

样例输出

0 2 4 3

其中：

$\leq n \leq 10^5$ ；

$\leq m \leq 2\times 10^5$ ；

$s = 1$ ；

朴素 Dijkstra 算法 $O(n^2+m)$

它的基本思想是从源点开始，每次选择一个距离源点最近的未访问过的点，然后用它来更新其他点的距离，直到所有的点都被访问过或者找到了目标点。

数据结构：

数组dist[]：保存当前已经确定的最短路径的点，下标从 s 开始，下标 0 用作哨兵位。
数组visited[]：保存已经访问过的点。

具体步骤如下：

初始化数组dist[]：初始时，源点到自己的距离为 0，即dist[1]=0，源点到其他点的距离为无穷大，用一个很大且不容易溢出的正整数表示，如1e9或0x3f3f3f3f。
初始化数组visited[]：所有的点都未被访问过。
重复以下操作，直到所有的点都被访问过或者找到了目标点：
- 从未访问过的点中（也就是不在visited[]中），选择一个距离源点最近的点，记为 x。
- **[松弛操作]**将 x 标记为已访问，并用 x 来更新其他未访问过的点 y 的距离（即遍历），即如果通过 x 到达某个点 y 的距离比原来的距离更短，就更新距离数组中 x 的值为源点到 y 的距离加上 x 到 y 的距离。

注意，x 就是当前最短路径的最新的那个点，也是当前离原点最远的点，不断地这样找下一个最近的点，就能找到整张图中离原点的最短路径。

每次用 x 找最近的下一个点，就好像在一个以 x 为起点的子图中找最短路径，那么递归地从倒数第二个点往前看，每一个子图连上一个最近的点，就是更大的那个子图的最短路径。

松弛操作：

松弛操作：是最短路径算法中的一种基本步骤，用于更新顶点之间的最短距离估计值。松弛操作的原理是，如果从源点 $s$ 到顶点 $u$ 的最短距离加上从顶点 $u$ 到顶点 $v$ 的边的权重小于从源点 $s$ 到顶点 $v$ 的最短距离，那么就可以用前者替换后者，从而缩短从 $s$ 到 $v$ 的路径。

对边 $(u, v)$ ，用 $d i s t (u)$ 和 $l (u, v)$ 的和尝试更新 $d i s t (v)$ ，即：
$d i s t (v) = min (d i s t (v), d i s t (u) + l (u, v))$

例如下面就是一次成功的松弛操作：

松弛操作的名称来源于一个类比，把最短距离估计值看作是一根弹簧的长度，初始时弹簧是被拉伸的，随着最短路径的发现，弹簧的长度会缩短，也就是松弛。

松弛操作也可以理解为减少对变量的约束，使得满足三角不等式（在下面会提到它）的条件更加宽松。松弛操作是很多最短路径算法的核心，比如 Dijkstra 算法和 Bellman-Ford 算法，它们都是通过不同的方式来确定边的松弛顺序，从而求解最短路径问题。

用一个例子理解算法流程：

注意，在每轮更新时，都是找 dist 数组中值最小的那个对应的顶点的出边来更新其它点的，而不是按 dist 数组的顺序。

这个“其他点”指的是最小值对应的顶点的邻居顶点。在这步中，B 的 dist 值被松弛更新为 3，在目前对于 B 而言，这是一条道起点的最短路径。

那么现在已经有两个点，S 和 A 点已经被访问过了，它们将会作为最短路径的顶点之一，以后更新最短路时，无需再访问它们。用蓝色路线标记。

这样，便找到了最短路径：S->A->B->D->C->E。

算法的核心步骤是在 dist 中未访问过的顶点中用距离最小的那个，来更新它自己的邻居顶点。

代码

#include <iostream>
#include <cstring>

using namespace std;

int n, m, s;
const int N = 10010, INF = 1e9, M = 2 * N;
int gra[N][N], dist[M];
bool visited[N];

void dijkstra(int s)
{
	// 初始化
	memset(dist, 0x3f, sizeof(dist));
	memset(visited, false, sizeof(visited));
	dist[s] = 0;
	// 重复操作 n 次，每次选择一个最近的点
	for (int i = 0; i < n; i++)
	{
		// 在未被访问过的点中选择一个最近的点 x
		// min_dist 记录最小距离
		int x, min_dist = INF;
		for (int j = 1; j <= n; j++)
		{
			// 没有被访问过，且距离更小则更新
			if (!visited[j] && dist[j] < min_dist)
			{
				x = j;
				min_dist = dist[j];
			}
		}
		visited[x] = true; // 标记 x 已被访问
		// 用 x 来更新其他未访问过的点的距离
		for (int y = 1; y <= n; y++) // 松弛操作
			dist[y] = min(dist[y], dist[x] + gra[x][y]);
	}
	if (dist[n] == 0x3f3f3f3f)  puts("-1");
	else for (int i = 1; i <= n; i++) cout << dist[i] << " ";
}

int main()
{
	cin >> n >> m >> s; // 读入点数/边数/起点
	memset(gra, 0x3f, sizeof(gra));
	// 如果图中可能存在重边或自环，那么只读取那个较小的
	for (int i = 0; i < m; i++) // 注意是读入边，所以是 m
	{
		int x, y, z;
		cin >> x >> y >> z;
		gra[x][y] = min(gra[x][y], z);
	}
	for (int i = 1; i <= n; i++) gra[i][i] = 0;
	dijkstra(s);
	return 0;
}

注意：这段代码无法通过 OJ，原因是朴素的 Dijkstra 算法时间复杂度很高，OJ 限制了内存。Dijkstra 算法的时间复杂度取决于实现方式，如果使用邻接矩阵（即二维数组）来存储图，那么时间复杂度为$ O(n^2)$，其中 $n$ 是图中的点数。

OJ 题的限制是一回事，使用邻接矩阵来存储图的原因是这个图是稠密图，也就是边数 $∣ E ∣$ 接近 $∣ V ∣$ ，稀疏图反之。主要是因为使用了二维数组来存储图的邻接矩阵，这样会占用很多空间，尤其是当图的边数远小于点数的平方时。可以使用邻接表来优化代码，这样只需要存储每个点的相邻点和边权，可以节省很多空间。

堆优化 Dijkstra 算法 $O ((n + m) l o g n)$

堆优化 Dijkstra 算法解决了：

二维数组占用过多内存
遍历顶点效率低

思路和朴素的 Dijkstra 算法是一样的，只不过是把二维数组中的数据交给堆来维护，遍历的操作通过堆来实现。这么做就不能用二维数组来存储图了，需要用链式前向星来存储图的邻接表（在本文的「图的存储方式」中有介绍）。

数据结构：

数组dist[]和数组visited[]：保存当前已经确定的最短路径的点和是不是第一次第一次出队（这和朴素 Dijkstra 中的 visited 数组的含义是不同的）。
堆priority_queue<pair<int, int>> heap：存储没有被访问过的点，堆自动会将最小值放在堆顶。first 存储距离，second 存储节点本身的编号（不是数组的下标）。
链式前向星：存储邻接表。

具体步骤如下：

初始化数组dist[]和数组visited[]。
重复以下操作，直到堆heap为空：
- 从堆heap中取出堆顶元素 x，即距离当前路径最短的顶点，取出后弹出它。
- 判断 x 是否已经被访问过，如果是，则跳过这个点，因为它可能是一个重复的点，或者是一个已经确定最短距离的点。
- 如果 x 没有被访问过，就将其标记为已访问，并遍历 x 的所有出边，即从邻接表中找到所有与 x 相连的点 y 和边权 z。
- **[松弛操作]**将 x 标记为已访问，并用 x 来更新其他未访问过的点 y 的距离，也就是要遍历堆中每个元素，符合条件则更新点 y 的距离dist[y]，再将更新后的点 y 压入堆heap中。

代码

#include <iostream>
#include <queue>
#include <cstring>

using namespace std;

int n, m, s;
const int N = 100010, M = N * 2;
int head[N], ver[M], edge[M], Next[M], idx;
int dist[N];
bool visited[N];

// pair<-dist[x], x>
priority_queue<pair<int, int>> heap;
// 加边
void add(int x, int y, int z)
{
    idx++;
    ver[idx] = y;
    edge[idx] = z;
    Next[idx] = head[x];
    head[x] = idx;
}

void dijkstra(int s)
{
	// 初始化
	memset(dist, 0x3f, sizeof(dist));
	memset(visited, false, sizeof(visited));
	dist[s] = 0;
	heap.push(make_pair(0, s));
	while (!heap.empty())
	{
		int x = heap.top().second;
		heap.pop();
		if (visited[x]) continue;
		visited[x] = true;

		for (int i = head[x]; i != 0; i = Next[i])
		{
			int y = ver[i], z = edge[i];
			if (dist[y] > dist[x] + z)
			{
				dist[y] = dist[x] + z;
				heap.push(make_pair(-dist[y], y));
			}
		}
	}
	if (dist[n] == 0x3f3f3f3f)  puts("-1");
	else for (int i = 1; i <= n; i++) cout << dist[i] << " ";
}

int main()
{
	cin >> n >> m >> s; // 读入点数/边数/起点
	for (int i = 0; i < m; i++)
	{
		int x, y, z;
		cin >> x >> y >> z;
		add(x, y, z);
	}	
	dijkstra(s);
	return 0;
}

注意：

堆的元素的 first 值是负数，是因为优先队列默认按照大根堆的方式排序，也就是每次输出的是最大的元素。但是最短路径问题需要取最小值，所以把正值取反，这样就可以利用大根堆的性质实现小根堆的效果。

如果想修改优先队列以小根堆排序：在定义优先队列的时候，指定第三个模板参数：
```
priority_queue<int, int, greater<int>> heap; 
```
```
heap.pop();
if (visited[x]) continue;
visited[x] = true;
```
第一句和第三句表示：x 顶点第一次出队时，就给它打上「已访问」标记；第二句表示：除了第一次以外，再出队就直接跳过 x。

这是因为堆顶维护的是当前两个集合相连边的最小权值，第一次出队一定是当前堆中的最小值；如果是第二次出队，说明在它之前还有更小的值，那就不能再选 x 了。也就是说如果一个顶点被访问了多次，那么则意味着有比之前找到的更短的路径到达该节点，这与算法的保证相矛盾。这就保证了从起点到每个节点的最短路径只会被访问一次。即一张含有 $n$ 个顶点的图中，最短路径经过的最多顶点数是 $n - 1$ 。

即使节点 x 已经被访问过，也需要将它从优先队列（堆）中弹出吗？

需要，这是因为 Dijkstra 算法使用优先队列来存储待访问的节点，而优先队列中的节点是根据到起点的距离排序的。如果一个已经被访问过的节点仍然留在优先队列中，则会影响算法的效率。

[注] 实际上，删除堆顶元素会破坏堆的结构，这可能会降低效率，一种做法是将它置为无效值，使它不会成为堆顶，但是会增加代码的复杂度，好在建堆的时间复杂度是$ O(log n)$，所以还是直接删除。

时间复杂度：

朴素的 Dijkstra 算法中的松弛操作需要遍历二维数组的所有点来找到最小距离的点，这样的时间复杂度是 $O(n^2)$ （其中 $n$ 是点的个数）。如果用堆来优化，就可以用一个优先队列来存储未确定最短距离的点，每次从队列中取出距离最小的点，这样的时间复杂度是 $O (l o g n)$ ，然后再用 $O (l o g n)$ 的时间来更新其他点的距离，总的时间复杂度是 $O ((n + m) l o g n)$ （其中 $m$ 是边的个数）。这样可以提高效率，尤其是当图比较稀疏的时候。

补充

“无穷”的表示：

在使用 Dijkstra 算法解决「最短路径问题」时，使用到了数学上“无穷”的概念，计算机的内存有限，只能用一个绝对值很大的数字（通常是整数）来表示。

算法题目在设计时，数据的数量级的上限一般取 $10^9$ （不超过），即1e9。“无穷”的取值也可以是0x3f3f3f3f或0x7f7f7f7f或1<<30，它们的绝对值是 $1061109567$ 和 $2139062143$ 和 $1073741824$ ，这么做的原因是有时候会对这个“无穷大”的数字做运算，例如“无穷大的无穷大”，那么它们的两倍不会让 int-32bit（ $4294967295$ ）溢出。在代码中，这个很大的整数通常用INF来表示，意为“无穷”。

memset函数按字节初始化空间，只要数组中每个字节都是3f或者7f，那么数组的所有元素都是“无穷”，就无需使用循环来初始化数组了。

另外，在全局的变量是有默认值的，布尔类型的 visited 数组默认值是 false，在代码中为了对应思路，仍然显式地初始化了，可以省略。

Dijkstra 算法的局限性：

Dijkstra 算法的一个重要条件是图中的边的权重必须为正，否则算法可能会得到错误的结果。这是因为算法的贪心策略是基于假设每次选择最近的点都不会导致之后的路径变长。如果存在负权重的边，那么可能会出现通过更远的点反而使得路径变短的情况，从而违反了算法的贪心策略。

参考资料

Bellman-Ford 算法 $O (nm)$

题目：P3385 【模板】负环

Bellman-Ford 算法可以解决 Dijkstra 算法不能处理负权边的情况，和 Dijkstra 算法不同的是，它是基于「迭代」的思想：这一次不行，那就算下一次。它的核心思路是对所有的边进行 $n - 1$ 轮松弛操作，这样可以保证每个点的最短距离是正确的。因为在一个含有 $n$ 个顶点的图中，任意两点之间的最短路径最多包含 $n - 1$ 边（一条链）。下一次迭代的结果，是在本次的基础上进行的。

换句话说，第 $1$ 轮在对所有的边进行松弛后，得到的是源点最多经过一条边到达其他顶点的最短距离；第 $2$ 轮在对所有的边进行松弛后，得到的是源点最多经过两条边到达其他顶点的最短距离；依此类推，直到第 $n - 1$ 轮，得到的是源点到其他所有顶点的最短距离。如果在第 $n$ 轮时（也可能是之后），还有可以松弛的边，那么说明存在负权回路。

如果没有负权回路，那么所有点的最短距离在 $n - 1$ 轮之后就不会再变化了；反之沿着这个负权回路走一圈，就可以使得某些点的最短距离变得更小，理论上能到数学意义上的无穷小，这样就会导致松弛操作无法收敛到一个确定的值。

算法流程：

初始化数组dist[]。
执行多轮迭代，每次迭代都对图上所有边尝试一次松弛操作。
当某一次迭代松弛操作失败，即某一次迭代中所有顶点的dist[x]都没有发生变化，算法终止。

下面用一个例子来理解算法流程：

第一轮迭代：

枚举每条边，也就是遍历每个顶点，然后枚举它们的所有出边，理论上这个顺序可以是任意的，通常按照编号来枚举边，也就是例子中 S->E 这个顺序。

注意当枚举 B 的出边之前，B 到起点的距离仍然是无穷的，所以在这个基础上再扩展一次也没有任何意义，所以先跳过它。如果 B 点是其他点的下一个点，那么可能后面的点或者下一轮迭代可以用其他点来更新 B 点的 dist，这样就能枚举 B 的出边了。

事实证明这么做是可行的，最后的 E 点的出边指向了 D 点，那么它可以更新 D 点的 dist。那么下一轮迭代就可以枚举 D 点的出边了。

第二轮迭代：

可见，随着迭代的继续，有许多顶点都不能再更新它的出边的 dist 值了，这说明算法接近尾声，最短路逐渐确定。

为了演示的方便，第三次迭代中只显示松弛操作成功的顶点，不成功的顶点编号不会被染色。

那么在最短路存在的情况下，一次迭代会使最短路的边数至少+1，而起点到每个顶点的最短路经过的边数最多为 $n - 1$ ，因此这个算法最多会进行 $n - 1$ 轮迭代（例如一条链）。每轮迭代最坏可能要枚举所有边，每轮迭代时间复杂度为 $O (m)$ ，整体时间复杂度为 $O (nm)$ 。

判断图中是否存在负环：

通过上面这个例子我们可以知道，这个算法最多进行 $n - 1$ 轮迭代，而且迭代这么多次以后就不会有顶点的 dist 值发生变化了。在『扩展最短路径』的意义下，如果图中存在负环，那么最短路径的长度理论上是无穷小，这意味着循环会迭代无穷次。所以要找到负环，只要在 $n - 1$ 的基础上再循环一次，如果这一次循环中某个顶点的 dist 值发生了变化，则说明有环。（这在代码中体现了）

代码

#include <iostream>
#include <queue>
#include <cstring>

using namespace std;

int n, m, s;
const int N = 100010, M = 2 * N;
int head[N], ver[M], edge[M], nxt[M], idx;
int dist[N];

void add(int x, int y, int z)
{
	idx++;
	ver[idx] = y;
	edge[idx] = z;
	nxt[idx] = head[x];
	head[x] = idx;
}

void BellmanFord(int s) // s 是起点
{
	memset(dist, 0x3f, sizeof(dist));
	dist[s] = 0;
	bool relax; // 标记是否松弛成功
	// 进行 n-1 次迭代+最后一次检验是否有环
	for (int i = 1; i <= n; i++) // 枚举每条边
	{
		relax = false; // 初始化
		for (int x = 1; x <= n; x++) // 枚举每个顶点
		{
			// 距离为无穷大，说明它肯定不是 x 经过的最短路径
			if (dist[x] == 0x3f3f3f3f) continue; 
			// 枚举以 x 为起点的所有出边
			for (int i = head[x]; i != 0; i = nxt[i])
			{
				int y = ver[i], z = edge[i];
				if (dist[y] > dist[x] + z) // 松弛操作
				{
					dist[y] = dist[x] + z;
					relax = true; // 成功后标记
				}
			}
		}
		// 如果没有任何松弛操作发生，就提前结束循环，因为已经找到了最优解
		if (!relax) break;
	}
	// 第 n 轮循环松弛失败，说明有环
	if (relax == false) cout << "NO" << endl;
	else cout << "YES" << endl;
}

int main()
{
	int t;
	cin >> t;
	while (t--)
	{
		idx = 0, memset(head, 0, sizeof(head));
		cin >> n >> m;
		for (int i = 0; i < m; i++)
		{
			int u, v, w;
			cin >> u >> v >> w;
			add (u, v, w);
			if (w >= 0) add (v, u, w);
		}
		BellmanFord(1); // 以 1 为起点
	}
	return 0;
}

注意：

if (dist[x] == 0x3f3f3f3f) continue; 这一行的作用是提高效率，因为没有它的话后面的松弛操作会失败。这是因为如果一个点的距离为无穷大，那么它不可能通过任何边来更新它的距离，所以没有必要遍历它的出边。这样可以节省一些时间，尤其是当图中有很多不连通的点时。（在这道 OJ 中，如果没有这一步优化，会卡数据）

参考资料

SPFA $O (km) / O (nm)$

题目：

在 Bellman-Ford 算法中，存在负权边的图可能存在负环，只有途经负环的图没有意义，也就是不存在最短路径。所以每个顶点最多只能扩展一次，为了保证这一点，借鉴 Dijkstra 算法的堆优化，即考虑使用堆来实现这个效果。

如果有负权边，那么每个点只更新一次的话可能无法保证路径是最短的，这样就会造成效率低下，办法是取消“一次”的限制。

算法流程其实就是将 Bellman-Ford 算法中枚举顶点的操作用堆来维护：

算法停止条件（如果没有负环）：每个边都能成功进行松弛操作，即都符合三角不等式。
如果存在负边，堆的存在并不能使得取最小值这个操作是最优的，也就是说负边的存在可能会使得后面还会出现更小的值。那么这样不得不一直取堆顶元素，直到取出最小的元素。但是这是本末倒置的，因为使用堆来取最小值，时间复杂度是 $O (1)$ ，现在变成了 $O (l o g n)$ 。

因此不能使用堆来维护顶点集合，考虑使用一个队列维护所有未被扩展的边。类似地，为了判断顶点 x 是否被扩展过，使用一个布尔类型的数组visited[]标记。

上面只是一个算法改进的尝试过程，下面是大多数教程介绍的思路。

通过 BellmanFord 算法中的例子我们知道，除了第一轮迭代之外，常常会有一些顶点无法更新它的邻居顶点的 dist 值，这是因为每一次迭代进行的松弛操作的参数值都是基于上一次迭代的结果而言的。

换句话说，只有在上一次迭代中被更新了 dist 的顶点，才有可能去更新其他顶点（你可以再看看那个例子验证）。因此在每一次迭代时将更新过 dist 的顶点用一个队列维护（如果已经在队列中则不加），在下一次迭代时只需要遍历队列中的顶点的出边即可。这样就可以省去很多重复且失败的松弛操作。

使用队列优化的 BellmanFord 算法，即 SPFA（The Shortest Path Faster Algorithm）的算法流程：

初始化变量
当队列不为空时，重复以下步骤：
- 取出队首元素 x，并将其出队，将 visited[x] 设为 false。
- 遍历以 x 为起点的所有边 (x, y) 进行松弛操作：
  - 如果 y 不在队列中，将 y 入队，并将 visited[y] 设为 true。
  - 如果 y 入队的次数 cnt[y] 超过了顶点数 n，说明存在负权环，返回 true。
如果没有发现负权环，返回 false。

SPFA 算法的核心思想是利用队列来存储待松弛的点，每次从队列中取出一个点，对其相邻的点进行松弛操作，如果有更新，就将相邻的点入队。这样可以避免对所有的边进行多次松弛，提高了效率。

代码

#include <iostream>
#include <queue>
#include <cstring>

using namespace std;

int n, m, s;
const int N = 100010, M = 2 * N;
int head[N], ver[M], edge[M], nxt[M], idx;
int dist[N], cnt[N]; // cnt 数组存储各个点入队的次数
bool visited[N];
queue<int> q; // 用于存储待松弛的点

void add(int x, int y, int z)
{
	idx++;
	ver[idx] = y;
	edge[idx] = z;
	nxt[idx] = head[x];
	head[x] = idx;
}

bool spfa(int s) 
{
	memset(cnt, 0, sizeof(cnt)); 
	memset(dist, 0x3f, sizeof(dist));
	memset(visited, false, sizeof(visited));
	dist[s] = 0;
	q.push(s);visited[s] = true; // 将源点入队，并标记为已访问
	while (!q.empty()) // 当队列不为空时，循环执行
	{
		int x = q.front(); q.pop(); visited[x] = false; // 取出队首元素 x，并出队，标记为未访问
		for (int i = head[x]; i != 0; i = nxt[i]) // 遍历以 x 为起点的所有边
		{
			int y = ver[i], z = edge[i]; // y 是边的终点，z 是边的权值
			if (dist[y] > dist[x] + z) // 如果可以通过 x 到 y 的边松弛 y
			{
				dist[y] = dist[x] + z; // 更新 y 的最短距离
				if (++cnt[y] > n) return true; // 如果 y 入队的次数超过了 n，说明存在负权环，返回 true
				if (!visited[y]) // 如果 y 不在队列中
					q.push(y), visited[y] = true; // 将 y 入队，并标记为已访问
			}
		}
	}
	return false; // 如果没有发现负权环，返回 false
}

int main()
{
	int t;
	cin >> t;
	while (t--)
	{
		idx = 0, memset(head, 0, sizeof(head));
		cin >> n >> m;
		for (int i = 0; i < m; i++)
		{
			int u, v, w;
			cin >> u >> v >> w;
			add (u, v, w);
			if (w >= 0) add (v, u, w);
		}
		if (spfa(1) == true) puts("YES");
		else puts("NO");
	}
	return 0;
}

注意：

由于 OJ 是在循环中进行多次询问的，所以在执行算法之前要将全局的变量清空。
在将顶点 x 入队和出队后，要立刻更新 visited[x] 的状态。

SPFA 的最坏时间复杂度是 $O (nm)$ ， $n$ 是顶点数， $m$ 是边数。最坏情况发生在图中存在大量的负权边，导致每个点都要入队多次，或者存在特殊构造的边，使得 SPFA 算法的队列顺序不利于松弛操作（总之要入队多次）。在图中没有或负权边很少的情况下，SPFA 的效率可以达到 $O (km)$ ， $k$ 是每个点的平均入队次数（在稀疏图中通常小于 2，是一个常数）。

参考资料

302 最短路 Bellman-Ford 算法 SPFA 算法|哔哩哔哩

最小生成树

题目描述

如题，给出一个无向图，求出最小生成树，如果该图不连通，则输出 orz。

输入格式

第一行包含两个整数 $N, M$ ，表示该图共有 $N$ 个结点和 $M$ 条无向边。

接下来 $M$ 行每行包含三个整数 $X_i,Y_i,Z_i$ ，表示有一条长度为 $Z_i$ 的无向边连接结点 $X_i,Y_i$ 。

输出格式

如果该图连通，则输出一个整数表示最小生成树的各边的长度之和。如果该图不连通则输出 orz。

样例

样例输入

样例输出

图论知识回顾：

子图是节点集和边集分别是某一图的节点集的子集和边集的子集的图。
生成子图是一个包含图中全部顶点的子图。也就是说每个顶点都是连通的。
生成树是一个包含图中全部顶点，即含有 $n$ 个顶点，而且由 $n - 1$ 条边组成的无环子图。
最小生成树（Minimum Spanning Tree，MST）是最小权重生成树（Minimum Weight Spanning Tree）的简称，是一副连通加权无向图中一棵权值最小的生成树。权值最小是指边的权值之和小于或者等于其它生成树的边的权值之和。

如果原图不连通，则没有最小生成树。因为不满足生成子图的条件，自然无法构成最小生成树。

最小生成树的分类主要有以下几种：

根据图的稀疏或稠密，最小生成树可以用 Kruskal 算法，Prim 等算法求得。这些算法的基本思想都是从小到大或从大到小选择边，使得构成的子图是连通的，且没有环路。

在学习这两个算法之前，你可以参看这个动画演示作为引入，以更好地理解算法的流程。

朴素 Prim 算法 $O(n^2 + m)$

（朴素）Prim 算法是一种求解图的最小生成树的贪心算法，它的基本思想是从一个顶点开始，逐步扩展生成树，每次选择权值最小的边和顶点加入到生成树中，直到所有的顶点都被覆盖。这和朴素的 Dijkstra 算法非常类似，不同的是 Prim 算法的目的是求最小生成树，它只关心边的权值，而不关心路径的长度。

Prim 算法的核心思路是将图中顶点根据是否在最小生成树中，划分为两个集合，这可以通过一个 bool 数组visited[]来实现。每次在加入新顶点到最小生成树集合中时，都是根据这两个集合之间的最小权值的边来选择下一个顶点的。

Prim 算法的流程如下：

初始化一个数组visited[x]，用于存储已经加入生成树的顶点 x，以及一个数组minDist[]，用于存储从visited[]集合到其他顶点的最小权值。将任意一个顶点加入visited[]，并将其对应的 minDist 值设为 0，将其他顶点的 minDist 值设为无穷大。
重复以下步骤，直到visited[]包含所有的顶点：
- 从minDist[]数组中选择一个权值最小的顶点 x，并将它加入到visited[]集合中，标记 visited 值为 true。
- 遍历 x 的所有邻接顶点 y，如果 y 不在visited[]中，且 x 到 y 的权值小于 y 的 minDist 权值，就更新 y 的 minDist 值为 x 到 y 的权值，表示 x 是 y 的父节点。
[可选] 最后，根据 minDist 数组和父节点的信息，输出最小生成树的边和权值。

用一个例子来理解算法的流程：

注意这里的 minDist 数组和最短路径算法中的 dist 数组的含义是不同的。

这个算法需要将顶点视为两个集合，每次扩展的都是两个集合之间权值最小的边。找的时候是通过顶点编号在第二行的 minDist 数组中找到两个集合之前的最小权值。

当找到这条边时，还需要用这条边的蓝色顶点来更新它的蓝色邻居顶点的 minDist 值。

当所有点都被选择进最小生成树集合中，算法停止。因为最小生成树的顶点数和图的顶点数相同。

代码

#include <iostream>
#include <cstring>

using namespace std;

const int N = 5010;
int n, m, ans, cnt;
// minDist 存储每个顶点到已选集合的最短距离，pre 存储每个顶点的前驱
int gra[N][N], minDist[N], pre[N];
bool visited[N]; // 标记顶点是否已经加入已选集合（最小生成树）中
bool prim(int s)
{
	memset(minDist, 0x3f, sizeof(minDist));
	minDist[s] = 0, ans = 0;	// ans 是最小生成树的权值和
	for (int i = 0; i < n; i++) // 循环 n 次，每次选择一个顶点加入到已选集合中
	{
		int x = -1;					 // x 表示当前要选择的顶点
		for (int y = 1; y <= n; y++) // 遍历所有顶点，找到距离已选集合最近的顶点
		{
			// 如果顶点 y 没有被访问过，且距离比当前的 x 小，就更新 x 为 y
			if (!visited[y] && (x == -1 || minDist[y] < minDist[x]))
				x = y;
		}
		if (i) ans += minDist[x]; // 如果不是第一次循环，就将 x 的距离累加到权值和中
		if (i && minDist[x] == 0x3f3f3f3f) return false; // 如果找不到最小的边，说明图不连通，返回 false
		// 更新其他顶点到已选集合的距离
		for (int y = 1; y <= n; y++)
		{
			if (minDist[y] > gra[x][y]) // 如果通过 x 能够缩短距离
			{
				minDist[y] = gra[x][y]; // 更新 minDist 数组
				pre[y] = x;				// 更新 pre 数组，记录 y 的前驱节点是 x
			}
		}
		visited[x] = true;
	}
	return true; // 如果找到了 n-1 条边，说明图连通，返回 true
}

int main()
{
	cin >> n >> m;
	memset(gra, 0x3f, sizeof(gra));
	for (int i = 0; i < m; i++)
	{
		int x, y, z;
		cin >> x >> y >> z;
		if (x != y) // 排除自环
		{
			gra[x][y] = min(gra[x][y], z); // 取最小的权重
			gra[y][x] = min(gra[y][x], z);
		}
	}

	if (prim(1)) cout << ans << endl;
	else puts("orz");
	// 打印路径
	// for (int i = 1; i <= n; i++) // 对于每个顶点
	// {
	// 	for (int v = i; v != 0; v = pre[v]) // 从当前顶点开始反向追踪
	// 		cout << v << " <- ";
	// 	cout << "1" << endl; // 源顶点是路径的起点
	// }

	return 0;
}

注意：

需要考虑到图中可能存在重边和自环的情况，在输入边的时候，加上一句 gra[x][y] = min(gra[x][y], z); 来保证取最小的权重；加上一个判断 if (x != y) 来排除自环。
（本题不存在）图中可能有多个连通分量的情况，也就是图不是连通的，而是由若干个子图组成。这样在求最小生成树的时候，应该对每个连通分量都进行一次 Prim 算法，而不是只对一个节点为起点的连通分量进行。
代码中使用了矩阵存储图，这是因为朴素的 Prim 算法适用于稠密图，当然也可以使用邻接表来存储表。
在 minDist 中找一个最小值的顺序可以是任意的，这是因为最小生成树已经被确定了（如果存在的话），顺序不会影响。

堆优化 Prim 算法 $O ((n + m) l o g n)$

和朴素的 Dijkstra 算法类似：朴素的 Prim 算法的时间复杂度是 $O(n^2+m)$ ，最多需要 $n^2$ 次找到一个 mindist 值， $m$ 条边都会被扩展一次。瓶颈在于每次从未标记的顶点中选择一个距离已选集合最近的顶点，这个过程需要遍历所有的顶点，所以需要 $O (n)$ 的时间。如果使用堆来维护两个集合之间的最小距离，可以将时间复杂度降低到 $O ((n + m) l o g n)$ ，其中 $n$ 是图中的点数， $m$ 是图中的边数。

需要注意的地方和堆优化的 Dijkstra 算法也是一样的：

visited[]数组表示的是顶点是不是第一次出队。
在 x 出队后要立刻标记 x 已经出了一次队。
堆<int, int>存储的是<-minDist[x], x>，默认以大根堆存储，已选集合和未选集合之间的 minDist 用负数存储。

代码

#include <iostream>
#include <cstring>
#include <queue>

using namespace std;

int n, m, ans, cnt;
const int N = 5010;

int gra[N][N], minDist[N];
bool visited[N]; // 标记 x 顶点是否是第一次出队
// <-minDist[x], x> 距离，编号
priority_queue<pair<int, int>> heap;

bool prim(int s)
{
	memset(minDist, 0x3f, sizeof(minDist));
	minDist[s] = 0, ans = 0;
	heap.push(make_pair(0, s));
	while (!heap.empty())
	{
		int x = heap.top().second; heap.pop(); // 出队
		if (visited[x]) continue; // 只对第一次出队的顶点操作
		visited[x] = true; // 标记
		ans += minDist[x]; cnt++; // 累计权值，记录出队过的顶点数
		for (int y = 1; y <= n; y++)
			if (minDist[y] > gra[x][y]) // 如果通过 x 能够缩短距离
			{
				minDist[y] = gra[x][y]; // 更新 minDist 数组
				heap.push(make_pair(-minDist[y], y)); // 可以更新则入队
			}
	}
	return cnt == n;
}

int main()
{
	cin >> n >> m;
	memset(gra, 0x3f, sizeof(gra));
	for (int i = 0; i < m; i++)
	{
		int x, y, z;
		cin >> x >> y >> z;
		if (x != y) // 排除自环
		{
			gra[x][y] = min(gra[x][y], z); // 取最小的权重
			gra[y][x] = min(gra[y][x], z);
		}
	}
	if (prim(1)) cout << ans << endl;
	else puts("orz");
	return 0;
}

堆优化的 Prim 算法适用于稀疏图，时间复杂度和 Kruskal 算法在同一个水平，但是前者的思路和代码更复杂，所以堆优化的 Prim 算法常被 Kruskal 算法替代。

参考资料

Kruskal 算法 $O (m l o g m)$

Kruskal 算法是一种求解图的最小生成树的贪心算法。它的基本思想是将所有点看作不同的集合，将所有边按权值从小到大排列，然后按顺序选取每条边，如果这条边的两个端点不属于同一集合，那么就将它们合并，并将这条边添加到最小生成树的边集中，直到所有的点都属于同一个集合为止。

值得注意的是，在 Kruskal 算法中（在查找最小生成树的意义下），「集合」指的是一个「连通块」。合并两个集合，需要使用并查集实现，也就是从两个连通块中各自取出一个顶点将它们相连，这样就合并为一个更大的连通块，即一个集合。在并查集中，通常用一个「代表元」来作为其他元素的父亲节点，所以判断元素是否在同一个集合中，只需要判断它们的代表元是否相同。

数据结构：

edges[i]数组：每个元素是一个结构体struct edge，存储了第i条边 $(x, y)$ 以及权值 $w$ 。在这个结构体edge中，重载了操作符operator<()，以支持调用库函数sort()进行排序。
fa[x]数组：存储的是 x 顶点并查集的代表元。

在动画演示中，人手动操作起来还是比较简单的，就是从排序好的边集中选取一条边x->y，使得它在当前最小生成树边集中不构成环。转换成图论语言，就是x和y不在一个集合中。

关于并查集的实现，可以在我的博客第 2 章：数据结构【AcWing】中查看。

算法流程：

初始化并查集，将 n 个顶点存入 n 个独立的集合
将所有边按权值从小到大排序
选边，直到将 n-1 条边全部选取为止，按顺序枚举每一条边：
1. 如果这条边连接的两个顶点x和y通过并查集得知不在同一集合，就将这条边加入最小生成树的边集中，并合并x和y所在的集合（查找x和y的代表元）。
2. 如果这条边连接的两个顶点x和y通过并查集得知在同一集合，跳过它。

用一个例子来理解算法流程，在演示的过程中，同时记录了并查集的路径压缩。

在图中的红色路径表示这条边加入到最小生成树的边集中。

在演示过程中，默认用编号小的那个顶点作为并查集的父节点，但是在合并两个高度相差悬殊的集合时，通常按秩合并，即小集合并入大集合（按高度）。为了后续查找的方便，通常会压缩路径，即尽量将并查集的高度保持在 2 层，所有孩子节点都是「代表元」。这是因为并查集在查找时是通过指定元素往前找父亲节点，直到找到「代表元」。

省略了路径压缩的步骤（这不是重点），只要合并后的集合的代表元是同一个即可。

当每个顶点的集合都是同一个时，算法停止：

代码

#include <iostream>
#include <algorithm>
#include <cstring>

using namespace std;

const int N = 200010;
int n, m, ans, cnt, fa[N];
struct edge
{
	int x, y, w;
	bool operator< (const edge &e) const
	{
		return w < e.w;
	}
}edges[N];

// 并查集查找+路径压缩
int find(int x)
{
	if (fa[x] == x) return x;
	return fa[x] = find(fa[x]);
}

bool kruskal()
{
	sort(edges, edges + m); // 排序
	for (int i = 1; i <= n; i++) fa[i] = i; // 初始化并查集
	for (int i = 0; i < m; i++) // 枚举每条边
	{
		// 取出这条边的两个顶点所在集合的代表元
		int x = find(edges[i].x);
		int y = find(edges[i].y);
		if (x != y) // 不在同一个集合
		{
			fa[x] = y; // 将 x 所在集合合并到 y 的
			ans += edges[i].w;
			cnt++; // 加入最小生成树边集中
		}
	}
	return cnt == n - 1;
}

int main()
{
	cin >> n >> m;
	for (int i = 0; i < m; i++)
	{
		int x, y, z;
		cin >> x >> y >> z;
		edges[i] = {x, y, z};
	}
	if (kruskal()) cout << ans << endl;
	else puts("orz");
	return 0;
}

注意：

在算法流程的演示过程中为了方便演示，使用了按秩合并，但是算法中没有（可选），实际上通过路径压缩，最后也能达到类似的效果。将 y 所在集合的代表元赋值给 x 的代表元，这就直接 x 插入到了 y 所在集合。
在算法的最后，要用计数器判断是否 n-1 条边都被加入到了最小生成树边集中。

Kruskal 算法的思路和代码都不复杂，甚至核心逻辑只需要用一个循环枚举所有边，这个操作的时间复杂度是 $O (m)$ （当然也可以在这个循环中判断 cnt 是否提前达到了 n-1，使得时间复杂度优化到 $O (n)$ ），那么这个算法的性能瓶颈就是库函数sort()函数，它的时间复杂度是 $O (m l o g m)$ ， $m$ 是边数， $n$ 是点数。

实际上，sort()的数量级虽然在 $O (m l o g m)$ ，但是它的系数在各种情况下都是比较小的，仍然是最快的排序算法。这使得 Kruskal 算法在多数情况下（稀疏图）能比其他求最小生成树的算法更优秀。

参考资料

312 最小生成树 Kruskal 算法|哔哩哔哩

二分图

二分图（Bipartite Graph）也叫偶图或二部图，它的顶点可以分成两个互斥的独立集 U 和 V 的图，使得所有边都是连结一个 U 中的点和一个 V 中的点。顶点集 U、V 被称为是图的两个部分。等价地，二分图可以被定义成图中所有的环都有偶数个顶点。––二分图|维基百科

还记得小学的连线题吗？它就是一个二分图。也就是说蓝色或绿色顶点之间没有边相连。

判断一个图是否是二分图的常用方法：

染色法，可以用 DFS 或 BFS 实现
最大匹配数等于最小点覆盖数
Hopcroft-Karp 算法

染色法判定二分图 $O (n + m)$

性质：二分图不存在长度为奇数的环（简称奇环）。

假设这个图中存在一个奇数环，那么我们可以沿着这个环顺时针或逆时针遍历，每次遇到一个顶点，就给它染上与前一个顶点不同的颜色。由于这个环的长度是奇数，那么当我们回到起点时，它的颜色必然和第一个顶点的颜色相同，这就产生了矛盾，因为相邻的顶点颜色应该不同。所以，这个图中不存在奇数环。

也就是说，所有边的两个顶点一定属于两个不同的集合，从一个顶点出发，只有走偶数次才可能回到出发的那个集合。

染色法判定二分图：图能够被染成黑白两种颜色，且相邻的顶点颜色不同，即这个图是二分图。

其正确性的简单证明：

假设一个图中不存在奇数环，可以用深度优先搜索或广度优先搜索来进行染色。

任选一个未染色的顶点，给它染上任意一种颜色，比如黑色。然后，遍历它的所有邻接顶点，如果有未染色的顶点，就给它染上与当前顶点相反的颜色，比如白色，并继续遍历它的邻接顶点。如果遇到已经染色的顶点，就检查它的颜色是否和当前顶点相同，如果相同，就说明染色失败，返回 false；如果不同，就继续遍历。重复这个过程，直到所有顶点都被染色，返回 true。

要证明这个染色过程不会产生矛盾，即不会出现两个相邻的顶点被染成相同的颜色。假设出现了这样的情况，那么可以从这两个顶点出发，沿着它们的染色路径向上回溯，直到找到一个公共的祖先顶点，或者回到起点。这样，我们就构造了一个环，且这个环的长度是奇数，因为每次回溯都改变了一次颜色。这就和假设矛盾，因为这个图中不存在奇数环。所以，这个染色过程不会产生矛盾，即这个图是二分图。

数据结构：

邻接表存储图。
数组color[i]数组，存储第i个顶点的颜色。1是白色，2是黑色。或者说颜色是1或2。

算法流程：

初始化颜色color[]为0，表示未染色。
每次选择一个未被染色的顶点x，先将它染为1，然后用 DFS 枚举x的邻居顶点y。
1. 如果y未染色，DFS 进入。如果返回「有奇环」，则将y顶点所在的 DFS 路径往上一路返回「有奇环」。
2. 如果y已染色，且颜色与x相同，返回「有奇环」。
枚举完x的所有邻居顶点，如果没有发现奇环，则返回「没有奇环」。即这是一个二分图。

用一个例子理解算法流程：

注意，当判断已经染色后，还需要判断y的颜色是否和x（x 是 DFS 进入的入口顶点）的相同。在这个例子中，不存在奇环的情况。

这是一个极端且显然的例子，如果在 DFS 时遇到了已经染色并且颜色和 DFS 入口顶点颜色相同，那么说明它们是同一个集合中的，并且这会形成一个奇边数的环。

代码

#include <iostream>

using namespace std;

const int N = 100010, M = 2 * N;
int head[N], ver[M], nxt[M], idx;
int color[N]; // 表示每个点的颜色
int n, m;

void add(int x, int y)
{
    idx++;
    ver[idx] = y;
    nxt[idx] = head[x];
    head[x] = idx;
}
// x 表示当前节点，col 表示当前点的颜色
bool dfs(int x, int col)
{
  color[x] = col; // 将当前节点染色
  for (int i = head[x]; i != 0; i = nxt[i]) // 枚举 x 的所有邻点 y
  {
    int y = ver[i];
    if (!color[y]) // 如果 y 已经染色
    {
      if (dfs(y, 3 - col)) return true; // 连通块中出现了奇环
    }
    else if (color[y] == col) return true; // 如果 y 和 x 的颜色相同，说明是奇环
  }
  return false; // 没有奇环
}

int main()
{
  cin >> n >> m; // 读入点数和边数
  for (int i = 0; i < m; i++)
  {
    int x, y;
    cin >> x >> y;
    add(x, y);
    add(y, x);
  }
  bool flag = false; // 标记奇环
  for (int i = 1; i <= n; i++) // 枚举所有顶点
  {
    if (!color[i]) // 没有染色则 DFS
    {
      if (dfs(i, 1)) // DFS 入口染 1
      {
        flag = true; // 返回有环
        break; // 提前结束
      }
    }
  }
  if (flag) puts("No"); // 有奇环则不是二分图
  else puts("Yes");
  return 0;
}

注意：代码中的dfs(y, 3 - col)：col 是当前顶点 x 的颜色，那么它的意思是让 y 的颜色和 x 的不同，例如 col 是 1，那么 y 就是 2；如果 col 是 2，y 就是 1。

DFS 遍历所有点，对路径上的点交替染色，时间复杂度是 $O (n + m)$ ， $n$ 是点数， $m$ 是边数。

题目：

785. 判断二分图|LeetCode

补充

二分图有以下性质：

二分图的最大匹配数等于最小点覆盖数。其中，最小点覆盖数是指选取最少的点，使得每条边至少有一个端点被选中。
二分图的最大独立集大小等于顶点数减去最小点覆盖数。其中，最大独立集是指选取最多的点，使得这些点之间没有边相连。
二分图的最小点覆盖数等于顶点数减去最大匹配数。
二分图的最小割等于最大流。

参考资料

381 二分图判定染色法|哔哩哔哩

二分图最大匹配

题目描述

给定一个二分图，其左部点的个数为 $n$ ，右部点的个数为 $m$ ，边数为 $e$ ，求其最大匹配的边数。

左部点从 $1$ 至 $n$ 编号，右部点从 $1$ 至 $m$ 编号。

输入格式

输入的第一行是三个整数，分别代表 $n$ ， $m$ 和 $e$ 。

接下来 $e$ 行，每行两个整数 $u, v$ ，表示存在一条连接左部点 $u$ 和右部点 $v$ 的边。

输出格式

输出一行一个整数，代表二分图最大匹配的边数。

样例

样例输入

样例输出

匈牙利算法 $O (nm)$

匈牙利算法是基于增广路的思想，每次从左边未匹配点出发，寻找一条交错路径，如果能找到右边未匹配点，就可以增加一条匹配边，否则就尝试给已匹配的点换一个匹配对象，直到找不到增广路为止，此时意味着达到最大匹配。这可以用 DFS 和 BFS 实现。

数据结构：

x在左边，y在右边。
ans：记录最大匹配数。
邻接表存储表。
数组visited[y]：标记y顶点是否被访问过（不是被匹配）。
数组match[y]：存储y匹配的另一个顶点x。

算法流程：

从二分图中任选一个匹配作为初始匹配。
对于每个未匹配的点，尝试从它出发寻找一条增广路。
如果找到了增广路，就将增广路上的匹配边和非匹配边交换，从而增加一个匹配边，然后继续寻找下一个未匹配的点。
如果找不到增广路，就说明当前的匹配已经是最大匹配，算法结束。

DFS：

枚举左边n个顶点，每轮都要初始化visited[]为false，表示对于左边每个顶点，右边每个顶点都是可选的。DFS 返回「可配对」，计数ans++。
枚举左边第x个顶点的邻点y：
1. 如果y已访问过，跳过。
2. 如果y没有被访问且没有配对，即match[y]是 0，那么将y和x配对，标记y已访问。
3. 如果y没有被访问过且配对，即match[y]是x'（y 的原配），那么对x'进行 DFS，如果返回值是「可配对」，那么就将x和y配对（第三者），y和x'抛弃。标记y已访问。
4. 否则枚举x的下一个邻点。
当枚举完x的邻点后全都无法配对，返回false。

用一个例子理解算法流程：

每个 DFS 右边绿色的边表示目前已经被配对的边，右边红色的边表示目前的最大匹配，紫色边表示被废弃的边。当 DFS(2) 时，增广路是 2-6-1-7，将原本的匹配 1-6 增加到 1-7 和 2-6，那么 1-6 这条边就相当于被废弃了。

代码

#include <iostream>
#include <cstring>
using namespace std;

const int N = 100010, M = N * 2;
int head[N], ver[M], ntx[M], idx;
int n, m, k, ans;
bool visited[N]; // 标记右边顶点 y 是否被访问过
int match[N]; // 记录右边顶点 y 匹配的右边顶点 x'

void add(int x, int y)
{
    idx++;
    ver[idx] = y;
    ntx[idx] = head[x];
    head[x] = idx;
}
// dfs: 尝试为左边顶点 x 找到一个匹配的右边顶点 y
bool dfs(int x)
{
    for (int i = head[x]; i != 0; i = ntx[i]) // 枚举 x 的所有邻接边
    {
        int y = ver[i]; // 取出当前邻接边的右边顶点 y
        if (visited[y]) continue; // 如果 y 已经被访问过，说明已经尝试过匹配 y，跳过这个顶点
        visited[y] = true; // 否则，标记 y 为已访问
        if (!match[y] || dfs(match[y])) // 如果 y 没有匹配的左边顶点 x'，或者 x'可以找到另一个匹配的右边顶点
        {
            match[y] = x; // 那么就将 x 和 y 匹配起来
            return true; // 并返回 true，表示找到了一个匹配
        }
    }
    return false; // 如果遍历完所有邻接边都没有找到匹配，返回 false，表示没有找到匹配
}

int main()
{
    // n 和 m 表示左右点集数量
    cin >> n >> m >> k; // 变量 k 表示左右两边顶点之间的边的个数
    for (int i = 0; i < k; i++)
    {
        int x, y;
        cin >> x >> y;
        add(x, y);
    }
    // 遍历每一个左边顶点 x
    for (int i = 1; i <= n; i++)
    {
        // 对于每个 x, 右边都是可访问的
        memset(visited, 0, sizeof(visited));
        if (dfs(i)) ans++; // 尝试为 x 找到一个匹配的右边顶点
    }
    // 遍历完所有的 x，ans 即二分图的最大匹配数
    cout << ans << endl;
    return 0;
}

注意：

再次强调这个算法是将二分图视为两个点集和一个边集，只需要枚举其中一个边集，通过 DFS 就可以枚举从左边顶点出发的连通块，因为是二分图（每一条边的顶两个顶点一定是一左一右），所以必定可以访问到右边的顶点，然后回到左边未匹配的顶点。
DFS 的框架很明显：枚举 x 的邻边 y，然后看 y 是不是被访问过，没有访问过的话，就标记已访问 y，然后判断 y 是否符合某种条件，决定对其继续 DFS 还是直接返回。
算法的核心在于if (!match[y] || dfs(match[y]))，这是一个让 y 退而求其次的过程。
- 如果 y 没有匹配的左边顶点 x’，那么 y 和 x’就可以直接匹配。
- 或者 x’可以找到另一个匹配的右边顶点。也就是 x’可能不止一个心仪的 y’，但是都还没确定关系，所以让 x’放弃 y（即标记 y 已经匹配），现在 x 就能和 y 配对了。

这个算法的时间复杂度是 $O (nm)$ ，其中 $n$ 是左边顶点的个数， $m$ 是右边顶点的个数。这是因为每次调用 DFS 函数，都会遍历一个左边顶点的所有邻接边，而每个右边顶点最多被访问一次。