【学习笔记】KM 算法

OneInDark

已于 2022-08-17 15:43:49 修改

阅读量667

点赞数

分类专栏：图论 C++ 网络流文章标签：太没用了

于 2021-02-04 20:12:23 首次发布

本文链接：https://blog.csdn.net/qq_42101694/article/details/113628803

版权

C++ 同时被 3 个专栏收录

547 篇文章

订阅专栏

图论

122 篇文章

订阅专栏

网络流

27 篇文章

订阅专栏

本文深入探讨了二分图的概念，包括完美匹配和完备匹配，并详细介绍了匈牙利算法解决二分图最大匹配问题的过程，以及如何通过DFS和BFS实现。接着，文章重点讲解了KM算法，这是一种解决二分图最大权完美匹配的策略，通过边权转化为点权并调整点权来寻找增广路径。KM算法的时间复杂度和优化方法也进行了讨论。最后，提到了算法的推广，如何处理非完美匹配和最大权最大匹配问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

省流： $\rm KM$ 算法可以认为是 $\texttt{zkw}$ 费用流放在二分图最大权匹配上了。我们暂且希望它还能有常数上的优势吧。

壹、二分图

~~这个我实在不想讲。~~

1. 定义

可以用两种颜色将点染色，使得任意两个有边直接相连的节点的颜色不同，则该图为二分图。

任取一种染色方案（不妨设染成了黑白两色），染成黑色的点的集合是 $X$ 部（或写作 $\frak X$ 部），染成白色的点的集合是 $Y$ 部（或写成 $\frak Y$ 部）。

Comment. 有人问我为什么要用旧德式字体，我的回答是：~~我找不出其他任何地方会用到了~~。

2. 完美匹配

大小为 $|\frak X|=|\frak Y|$ 的匹配，就是完美的。

3. 完备匹配

指最大匹配等于 $\min(|\frak X|,|\frak Y|)$ 的情况。完美匹配是完备匹配的特殊情况。

贰、匈牙利算法

用于解决二分图最大匹配问题。

1. 增广路

任意取一个点 $x\in\frak X$ ，你可以试着去跟 $y\in\frak Y$ 匹配。如果 $y$ 已经有匹配了呢？就让原本与 $y$ 匹配的 $p\in\frak X$ 另寻新欢！也就是说，如果存在另一个匹配，能够维持现有匹配的大小，并且 $y$ 不在匹配中，那就可以加入 $\langle x,y\rangle$ 这条边。而想要 $y$ 不在匹配中，就必须让 $p$ 取消这个原有的匹配 $\langle p,y\rangle$ 。

如果所有 $p$ 都别无选择呢？那么 $x$ 是否匹配无所谓。毕竟我们需要的只是最大化匹配数量。 $x$ 的匹配必然带来别人匹配的丢失，同时 已匹配的 $y$ 的集合不变，所以 对后续匹配无影响。

如果用 $f (x)$ 表示能否让 $x$ 寻到一个匹配（为零则不可，为正数则可以），用 $p (x)$ 表示 $x$ 与谁匹配，则
$f(x)=\sum_{\lang x,y\rang\in{\Bbb E}}\big[p(y)=0\big]+f[p(y)]$

此时有一个大问题：转移有环！举个例子：原本 $\lang A,B\rang,\lang C,D\rang$ 玩得好好的，突然来个 $E$ 说： $D$ 给我， $C$ 滚蛋。然后 $C$ 找 $B$ ，说服 $A$ 找别人。 $A$ 看到了 $D$ ，结果又让 $C$ 去更换！

考虑 $f (x)$ 的作用：让某个 $x_0$ 获得匹配的机会。既然如此（~~好像没什么因果关系~~），我们 规定转移不能出现环。那么，在递归过程中，已经访问了 $S$ 集合中的点，就不能继续访问了。

转移确实无环了。但此时的 $f$ 似乎会算错……么？如果将 $f (x)$ 的计算视为 $\rm dfs$ 的计算，那么 $f [p (y)]$ 就是递归子状态。一个很重要的特点是，只要一个 $f\ne 0$ 就可以使得 $f(x)\ne 0$ ，因为它会从所有子节点得到信息。换句话说，我们只需要找到一个 $p (y) = 0$ 的递归出口。所以我们实质上只需要找出 $f(x_0)$ 可以到达的状态有哪些；故而状态转移中的环可以直接忽略。

于是暴力 $\tt dfs$ 求出 $f(x_0)$ 即可，时间复杂度是 $\mathcal O(n+m)$ 的。

求出了 $f(x_0)\ne 0$ 却找不到匹配，悲剧啊！当然你可以把 $\rm dfs$ 树建出来，然后一路往下。事实上， $\rm dfs$ 的回溯过程（返回值为 $\rm true$ 的那条链）中即可更改。

总复杂度 $\mathcal O(n^2+nm)$ ，但难以达到 $n^3$ ，因为稠密图的匹配很容易找到。——其实匈牙利的本质就是 $E K$ 求最大流，~~而网络流的复杂度是玄学~~。

2. 代码

由于 $f$ 可以保留，在 $\rm dfs$ 回溯时不清空 $v i s$ 数组。但是更改 $x_0$ 就需要清空了！

bool vis[MAXN]; // need to clear
vector<int> G[MAXN]; // graph
int match[MAXN]; // part Y
bool dfs(int x){
	if(vis[x]) return false;
	vis[x] = true; // remove cycle
	for(auto y : G[x]) // ∀ <x,y>
		if(!match[y] || dfs(match[y]))
			return match[y] = x, true;
	return false; // unable to change
}

而我们注意到，所有会访问到的 $x$ 都是 $ma t c h (y)$ ，除了最初的 $x_0$ ，并且它一定不会被 $ma t c h (y)$ 访问到。所以将 $v i s$ 数组定义在 $\frak Y$ 部上同样可行。效果是相同的，~~但是代码短了一行~~，在 $|\frak Y|<|\frak X|$ 时可以略微减小常数。

bool dfs(int x){
	for(int y : G[x])
		if(!match[y] || (vis[y] == false
		&& (vis[y] = true) && dfs(match[y])))
			return match[y] = x, true;
	return false;
}

还有 $\rm bfs$ 写法，据说性能更好，可是比较麻烦——比如没有了函数递归的隐式栈，我们要用 $p re$ 模拟栈来修改。

void getAugment(int y,int x){
	while(y != 0){
		match[y] = x;
		y = prex[x]; x = prey[y];
	}
}
bool bfs(int x){
	int *fro = que, *bac = fro+1;
	for(prex[*que=x]=0; fro!=bac; ++fro)
		for(int y : G[*fro]) if(!vis[y]){
			if(!match[y]) return getAugment(y,*fro), true;
			prey[y] = *fro, prex[match[y]] = y;
			*(bac ++) = match[y], vis[y] = true;
		}
	return false;
}

3. 例题

洛谷板题：用上面的 $\rm dfs$ 代码即可通过。这里只补充主函数。

int main(){
	int X = readint(), Y = readint();
	int m = readint();
	for(int i=1; i<=m; ++i){
		int x = readint();
		G[x].push_back(readint());
	}
	int ans = 0;
	for(int i=1; i<=X; ++i){
		memset(vis+1,0,X);
		if(dfs(i)) ++ ans;
	}
	printf("%d\n",ans);
    return 0;
}

劈配：我特意转载的匈牙利做法，为了让大家更熟悉匈牙利。~~其实是因为我没学懂网络流。~~

叁、 $\rm KM$ 算法

解决二分图最大权完美匹配。也就是说，保证是完美匹配时，让边权和最大。

1. 思想

把边权变为点权。为什么可以这样？或许是出于 $\rm LP$ 对偶吧，我猜。

边权完全等价地放在点上，不可能——否则我们将得出，所有的匹配的权值都是一样的，~~于是最大权匹配就讲完啦~~！所以我们只能考虑 “最大化” 背景下的转化。等式行不通，考虑不等式。令 $v (x)$ 为点权，那么必须满足
$\forall \lang x,y\rang\in{\Bbb E},\;v(x)+v(y)\geqslant w(x,y)$

这是基本性质。因为这一条可以保证 答案不超过点权和。而我们只需要想办法取到点权和。也就是让满足 $v (x) + v (y) = w (x, y)$ 的边构成完美匹配。称这些边为亮边，其余边为暗边。

模拟 $\rm Hungarian$ 算法的做法，考虑每次让一个 $\frak X$ 部的点获得匹配。如果亮边可以找到增广路，那就直接增广。否则，我们要调整点权，这也是算法的核心。实际上就一句话的事儿：对于 $\rm dfs$ 中访问过的每一个点，如果属于 $\frak X$ 部，将其权值减小 $d\;(d>0)$ ，如果属于 $\frak Y$ 部，将其权值增大 $d$ 。

来看看，这样操作之后会发生什么。不妨设 $\rm dfs$ 中访问了集合 $S$ 中的点。对于边 $\lang i,j\rang$ ，不妨设 $i\in{\frak X}$ 而 $j\in\frak Y$ ，分成四类来考虑。

如果 $i\in S,\;j\in S$ 或者 $i\notin S,\;j\notin S$ ，显然没有影响（基本性质仍然满足）。
如果 $i\in S,\;j\notin S$ ，那么这条边是暗边——因为 $\rm dfs$ 的对象是 $\frak X$ 部的点，这条边是亮边则必然被访问。现在 $v (i)$ 减小了，这条边可能变亮，但是也可能变得不满足基本性质。
如果 $i\notin S,\;j\in S$ ，天知道这条边是亮还是暗。反正 $v (j)$ 增大会让它暗下去，并且不可能导致非法情况。

为了使得第二类边不出问题（仍然满足基本性质：端点权值和不小于边权），取
$d=\min_{\lang i,j\rang,i\in S\cap{\frak X},j\notin S}\big[v(i)+v(j)-w(i,j)\big]$

而后 $S$ 必然增大。因为原有的边不消失，新加入的边一定可以用到。 $∣ S ∣ = 2 n$ 时，当前点必然获得一个匹配。如果我们每次操作都是 $\mathcal O(m)$ 暴力找 $d$ 加上 $\mathcal O(n{\rm+}m)$ 求增广路，一个点要操作 $n$ 次使得 $∣ S ∣$ 增大到 $2 n$ ，那么总复杂度 $\mathcal O[n\cdot n\cdot (n+m)]=\mathcal O(n^3+mn^2)$ 的。

你可能有这样的疑惑：一定存在二类边吗？答案是肯定的。否则，这说明 $S\cap{\frak X}$ 的邻点都属于 $S$ ，但是在 $S$ 中仍然找不到 $S\cap{\frak X}$ 的完备匹配——于是原图中也就不存在完美匹配了。

考虑到 $m=\mathcal O(n^2)$ ，整个算法并不是很快。复杂度瓶颈在于找 $d$ 以及求增广路，两个都和 $m$ 相关。我们尝试优化一下，先从求增广路开始吧！

算法流程中，每次 $∣ S ∣$ 只增大 $2$ ，也就是 只加入了一条边，但是我们要 从头开始 $\rm dfs$ 。这难道是合理的吗？而且终极目标都是给 $x_0$ 找到匹配罢了。上面 $\rm Hungarian$ 算法中也有提到，我们只需要知道从 $x_0$ 出发能走到哪些 $x\in\frak X$ 罢了。于是我们考虑保留 $\rm dfs$ 树原有形态，也就是说， $x_0$ 能走到的点还是能走到，只看能不能走到更多的点。

避免了多次增广，已经将一个点的 $\mathcal O(n)$ 次操作的总复杂度降至 $\mathcal O(n{\rm+}m)$ ，好耶！

接下来解决求 $d$ 的问题。用 ${\rm SY}(x)$ ，意思是 $\rm Search\;\frak Y$ 部，存储每个 $\frak Y$ 部的点 作为端点的边的最小值。即
${\rm SY}(y)=\min_{\lang i,y\rang,i\in S}\big[v(i)+v(y)-w(i,y)\big]\quad(y\in\frak Y)$

为什么不用 $\frak X$ 部的点呢？因为它们随着 $S$ 变大，条件 $j\notin S$ 越发难满足，而 $\min$ 是很难删除的。与此相对的是， ${\rm SY}(x)$ 是容易维护的，并且第二类边实际上加入的就是 $\frak Y$ 部的点，这与 $\tt prim$ 比较相似。

此时，我们只需要用 $\mathcal O(n)$ 扫一遍 ${\rm SY}$ 数组，就能找到我们要新加入的点。加入的点直接开始增广。增广的过程中还可以顺便修改 ${\rm SY}$ 的值，一举多得啊！

于是两个含有 $m$ 的操作都不见了！时间复杂度就变成 $\mathcal O(n^3+nm)$ 的了，基本上是匈牙利算法的复杂度。

2. 代码

洛谷题解区有许多 $\tt bfs$ 的代码，欲者自取。这里贴一份 $\tt dfs$ 的代码吧。

const int INFTY = (1<<30)-1;
const int NO_SUCH_THING = -INFTY;
const int MAXN = 502;
int g[MAXN][MAXN]; ///< if no edge exists, be @a NO_SUCH_THING
int match[MAXN], prex[MAXN], prey[MAXN];
void getAugment(int y,int x){
	while(y) match[y] = x, swap(y,prex[x]), x = prey[y];
}
int vx[MAXN], vy[MAXN], dis[MAXN];
bool vis[MAXN]; // defined on X part
int dfs(int x,const int &n){
	vis[x] = true; int d;
	for(int i=1,o; i<=n; ++i){
		if(g[x][i] == NO_SUCH_THING) continue;
		if(match[i] && vis[match[i]]) continue;
		if((d = vx[x]+vy[i]-g[x][i]) == 0){
			prey[i] = x; if(!match[i]) return i;
			if(!!(o = dfs(match[i],n))) return o;
		}
		else if(dis[i] > d) dis[i] = d, prey[i] = x;
	}
	return 0; // no augment path found
}
int main(){
	int n = readint();
	rep(i,1,n) rep(j,1,n)
		g[i][j] = NO_SUCH_THING;
	for(int m=readint(),a,b; m; --m){
		a = readint(), b = readint();
		g[a][b] = readint();
	}
	rep(i,1,n) rep(j,1,n)
		if(g[i][j] != NO_SUCH_THING)
			vx[i] = max(vx[i],g[i][j]);
	for(int x=1,o; x<=n; ++x){
		memset(vis+1,false,n);
		fill(dis+1,dis+n+1,INFTY);
		for(o=dfs(x,n); o==0; ){
			int_ slack = INFTY;
			rep(i,1,n) if(!vis[match[i]])
				getMin(slack,dis[i]);
			rep(i,1,n) if(vis[i]) vx[i] -= slack;
			rep(i,1,n) // Y part
				if(vis[match[i]]) vy[i] += slack;
				else if(dis[i] != INFTY) dis[i] -= slack;
			for(int i=1; i<=n&&o==0; ++i)
				if(!vis[match[i]] && !dis[i]){
					if(!match[i]) o = i;
					else o = dfs(match[i],n);
				}
		}
		getAugment(o,prey[o]);
	}
}

3. 注解

边权转为点权，还是不等式，这太糟糕了……它到底想干什么？仔细想想 $v(x)+v(y)\geqslant w(x,y)$ ，有点像松弛？难道说它是某种 最短路？也就是说——它其实就是最小费用流吗？

从最小费用流的角度考虑，边权是 $- w (x, y)$ ，令 $v (y)$ 变为原来的相反数，由上式有 $[-w(x,y)]+v(x)-v(y)\geqslant 0$ 。这就是最小费用流的 $\tt dijkstra$ 方法中的 “势函数” 嘛！

然而 $\tt dijkstra$ 方法中 $h (x)$ 就是残留网络上从 $S$ 出发的最短路，这里则应该是到汇点 $T$ 的距离。 $\rm KM$ 相当于假定 $d i s (x) = v (x)$ ，然后慢慢调整。~~用狗狗的话说：“好蠢呐！”~~

另外一个困扰了我很久的问题：顶标的范围有多大？值得注意的是，每次进行 $v (x)$ 减 $d$ 同时 $v (y)$ 加 $d$ 的操作时， $\sum v(x)+\sum v(y)$ 都减小了 $d$ ，因为 $x$ 的数量比 $y$ 多一个。显然 $\sum d=\mathcal O(nw)$ ，其中 $w$ 是边权的值域。那么 $v (x)$ 每次都减小 $d$ ，就可能达到 $n w$ 的修改量！

而这个上界是可以达到的——只需要让一条增广路径经过 $n{-}1)$ 条边权最大的边。也就是 $\frak X$ 部的 $i$ 号点向 $\frak Y$ 部的 $i{+}1)$ 号点连边，权值为 $\max v$ ，它们会最初作为匹配边；然后 $\frak X$ 部的 $i$ 号点向 $\frak Y$ 部的 $i$ 号点连边，权值为 $\min v$ ，为了达到完美匹配，不得不使用这些边。显然此时到 $T$ 的最短路长度是 $\mathcal O(nw)$ ，于是顶标也是这个范围了！