数据合并设计_数据结构—并查集上

d5c64347666b2b0e1671c435a0b15b27.gif

这是无量测试之道的第175篇原创

  今天主要介绍的是并查集这种数据结构。其本质上是解决某一些特定问题的而设计出的数据结构。大家可以了解下这种数据结构,作为自己知识的储备。

通过一个实际的问题引出并查集

  假设有 n 个村庄,有些村庄之间有连接的路,有些村庄之间并没有连接的路

c0d745cf79515006cae8538fdc2fa844.png

设计一个数据结构,能够快速执行 2 个操作:

  1. 查询 2 个村庄之间是否有连接的路

  2. 连接 2 个村庄

  如果使用数组、链表、平衡二叉树、集合(Set) 都可以完成需求,但是查询、连接的时间复杂度都是 O(n)。并查集能做到查询、连接的均摊时间复杂度都是 O(α(n)),α(n) < 5,非常适合解决这类“连接”相关的问题。

并查集(Union Find)

并查集也叫作不相交集合(Disjoint Set)


并查集有2个核心操作:

  • 查找(Find):查找元素所在的集合
    (这里的集合并不是特指Set这种数据结构,是指广义的数据集合)

  • 合并(Union):将两个元素所在的集合合并为一个集合

有 2 种常见的实现思路:

  • Quick Find
    查找(Find)的时间复杂度:O(1)
    合并(Union)的时间复杂度:O(n)

  • Quick Union
    查找(Find)的时间复杂度:O(logn), 可以优化至 O(?(?)), α(?) < 5
    合并(Union)的时间复杂度:O(logn), 可以优化至 O(?(?)), α(?) < 5

如何存储数据?

假设并查集处理的数据都是整型,那么可以用整型数组来存储数据。

  • 数组索引代表元素值

  • 索引对应的值代表这个元素的根节点

将{0,1,2,3,4,5,6,7}存储到数组中,如下图:

2a257e2ed03cf50825f66b18773359cd.png

  因此,并查集是可以用数组实现的树形结构(二叉堆、优先级队列也是可以用数组实现的树形结构)

并查集数据结构的接口定义

/**
* 查找v所属的集合(根结点)
*/
public abstract int find(int v);
/**
* 合并v1、v2所在的集合
*/
public abstract void union(int v1, int v2);
/**
* 检查v1、v2是否属于同一集合
*/
public boolean isSame(int v1, int v2);

isSame()的实现十分简单

public boolean isSame(int v1, int v2){
return find(v1) == find(v2);
}

元素的初始化

初始化时,每个元素各自属于一个单元素集合

00af8122089adb81b4271355b968a590.png

private int[] parents;
public UnionFind(int capacity){
if(capacity < 0){
throw new IllegalArgumentException("capacity must >= 1");
}
parents = new int[capacity];
for (int i = 0; i < parents.length; i++) {
parents[i] = i;
}
}

1.Quick Find

  Quick Find 的 union(v1, v2)让 v1 所在集合的所有元素都指向 v2 的根节点。
并且 Quick Find 的高度永远保持 <= 2。

union 示例及实现

例如:
  将{0,1,2,3,4,5}初始化为并查集,每个元素各自属于一个单元素集合:{0}, {1}, {2}, {3}, {4} 。

bdfe1b9cf862fe0fc3cdb6f06d1f1fc6.png

合并 1 和 0,union(1, 0),即 {1} 指向了 {2} 。

9f2ef1ac7476c79fe3a05b767b9aa758.png

然后,合并 1 和 2,union(1, 2),1 所在集合有 {0, 1},即 {0, 1} 指向了 2 。

44980527ee965dfb3480a6d2d70fbc60.png

再合并 3 和 4,union(3, 4),即 {3} 指向了 {4} 。

5d9fb4918dabc077c0666cd173a60353.png

合并 0 和 3,union(0, 3),0 所在集合为 {0, 1, 2},3 所在集合为 {3,4},如下:

efa4a1f7a739d09a973fb34ee02f4601.png

代码如下:

/**
* 将v1所在集合的所有元素都嫁接到v2的父节点上
* v1 v2 union(v1,v2)
* 0 4 4
* 1 2 3 0 1 2 3
*/
public void union(int v1, int v2){
int p1 = parents[v1];
int p2 = parents[v2];
for (int i = 0; i < parents.length; i++) {
if(parents[i] == p1){
parents[i] = p2;
}
}
}
union 时间复杂度:O(n)

find 实现

  Quick Find 查找的时候,由于数组中存储的就是根结点,因此直接取出即可。

5d9fb4918dabc077c0666cd173a60353.png

对上图执行 find():
find(0) == 2
find(1) == 2
find(2) == 2
find(3) == 4
/**
* 父节点就是根节点
*/
public int find(int v){
rangeCheck(v);
return parents[v];
}
find 时间复杂度:O(1)

总结:

  今天主要介绍了并查集这种数据结构,然后详细的讲述了Quick Find的实现思路。希望给大家的知识库增加一些新的知识储备。

end

如果今天的分享对你有帮助的话,请毫不犹豫:关注、分享、点赞、在看、收藏呀~
你的鼓励将会是我创作的最大动力。

f55908fb610eab8cb25bcc583607fc02.gif

◆Docker 镜像配置,看这一篇足矣。 ◆Docker 三大核心概念 ◆AirTest-selenium基于Web实现UI自动化测试 ◆Python API自动化测试实操(高清版配图) ◆自动化测试必会—PageObject 设计模式

点个赞,点个在看再走啦~~~

c257439ad399ee7592696075e7a4d5ab.gif
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值