并查集
基本定义
- 并查集作为一种非常精巧而实用的高级数据结构,用于处理不相交集合的合并问题
- 基本操作:
- 初始化
- 合并
- 查找
- 基本应用
- 连通子图
- 最小生成树Kruskal算法
- 最近公共祖先
初始化
def init_set():
for i in range(N): s.append(i)
#s = list(range(N))
初始化数组的元素均为自身索引
合并
近似于创建个体与个体间的联系
def merge_set(x,y):
x = find_set(x)
y = find_set(y)
if(x!=y): s[x] = s[y]
查找
查找元素的集,是一个递归的过程,直到元素的值和他的集相等,就找到了根节点的集。
对于递归搜索树,情况多种,可能很细长,复杂度O(N),则出现了退化现象
def find_set(x):
if(x!=s[x]): return find_set(s[x])
else: return x
若需查找有多少连通子集
- 则可直接find_set()查找,如果s[i] = i,即根节点,是所在集的代表
- 统计根节点数量,就是集的数量
那么是否可以对查找低效的递归进行优化呢?
路径压缩可以消除这种复杂的递归模型
路径压缩
基本思路:
- 查询程序find_set():沿着搜索路径找到根结点,这条路径可能很长。
- 优化:沿路径返回时,顺便把i所属的集改成根结点。下次再搜,复杂度是O(1)。
def find_set(x):
if(x != s[x]): s[x] = find_set(s[x])
return s[x]
优点:
- 路径压缩:整个搜索路径上的元素,在递归过程中,从元素i到根结点的所有元素,它们所属的集都被改为根结点。
- 路径压缩不仅优化了下次查询,而且也优化了合并,因为合并时也用到了查询。