并查集算法:并查集,在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中。这一类问题近几年来反复出现在信息学的国际国内赛题中,其特点是看似并不复杂,但数据量极大,若用正常的数据结构来描述的话,往往在空间上过大,计算机无法承受;即使在空间上勉强通过,运行的时间复杂度也极高,根本就不可能在比赛规定的运行时间(1~3秒)内计算出试题需要的结果,只能用并查集来描述。
并查集是一种树型的数据结构,用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。常常在使用中以森林来表示。
有两种主要的算法,一种是单链表实现,另一种是并查集森林实现,下面的是并查集森林的实现。
关键点理解:个人感觉主要的理解关键点在于对数组含义的理解,father[i]存储的数,代表的是编号为i的人的父辈的编号,这样来不停的查找这个辈分最大的人,所以这样说的话,每个集合或者说是家族,最后都会有一个辈分最大的人,而这个人就会用来区分两个人或者两个元素是不是同一个集合。另外一个关键点则是对路径压缩算法的理解,可以用一个图片来帮助理解:
#define N 100
int father[N];
void init() {
for(int i=0; i<N; i++)
father[i] = i;
}
// 合并两个元素所在的集合
void union(int x,int y) {
x = getfather(x);
y = getfather(y);
if(x!= y)
father[x]=y;
}
// 判断两个元素是否属于同一个集合
bool same(int x,int y) {
return getfather(x)==getfather(y);
}
// 获取根结点
int getfather(int x) {
while(x != father[x])
x = father[x];
return x;
}
// 获取根结点,是上边函数的改进,压缩了路径长度
int getfather(int x) {
if(x != father[x])
father[x] = getfather(father[x]); // 路径压缩修改的是father数组
return father[x];
}