并查集
概念:
并查集,在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中。
概括来讲,就是合并,搜索;
并查集是一种树型的数据结构,
用于处理一些不相交集合(disjoint sets)的合并及查询问题。
常常在使用中以森林来表示。
初始化
void INIT()
{
memset(fat,0,sizeof(fat));
for(int i=1;i<=n;++i){fat[i]=i;siz[i]=1;}
//一开始让每个节点做自己的父节点。
//大小设为1。
}
f a t ( f a t h e r ) fat(father) fat(father) 存元素所在的集合,可以理解为,这个元素的根。 f a t [ x ] fat[x] fat[x] 就是 x x x所在的集合, x x x的根。
s i z ( s i z e ) siz(size) siz(size) 可以理解为是这个集合的大小。
朴素
int Find(int x)
{
if(fat[x]==x) return x;//fat是指父节点
return Find(fat[x]);
}
void unionn(int x,int y)//unionn躲避关键字
{
x = Find(x); y = Find(y);
if(x!=y) fat[x] = y;
return ;
}
+启发式合并
在朴素的基础上,可以优化合并的过程:
每次将较小的集合并入较大的集合中。
这样,并查集的时间复杂度就会降至: O ( n l o g 2 n ) O(nlog_2n) O(nlog2n)
为什么
并查集是一种树型的数据结构,而树也有它的深度。
如果我们把一棵深度大的树的根节点接在了一棵深度小的树上,那么整棵树的深度为那一棵深度大的树的深度+1。
如果我们把一棵深度小的树的根节点接在了一棵深度大的树上,则整棵树的深度即是大树的深度,保持不变。
这使树的深度尽可能的小,在之后的树结构中就递归的层数更少。
启发式代码:
void unionn(int x,int y)
{
x = Find(x); y = Find(y);
if(siz[x]>siz[y]) swap(x,y);//加了这一句,加了判断大小的siz[]。
fat[x]=y; siz[y]+=siz[x];
}
+路径压缩
我们会发现,如果只是单纯的查找集合。
那么树中中间节点就是冗余的。
如果我们将这些中间节点在访问过后,直接将它们的父亲指向集合的代表元。
在后续访问中,就不会有这些冗余了。
(如果强调节点的父子关系,就不能使用路径压缩)
因为路径压缩会破坏本身的节点关系。
时间复杂度:随机数据极快,上界 O ( n l o g 2 n ) O(nlog_2n) O(nlog2n)。
int Find(int x)
{
return (fat[x]==x)? x : fat[x]=Find(fat[x]);
/*
if(fat[x]==x) return x;
return fat[x] = Find(fat[x]);//返回的时候,顺手把路径压缩了
*/
}
void unionn(int x,int y)
{
x=Find(x); y=Find(y);
if(siz[x]>siz[y]) swap(x,y);
fat[x]=y; siz[y]+=siz[x];
}