关于并查集
为了解释并查集的原理,我将举一个更有爱的例子。 话说江湖上散落着各式各样的大侠,有上千个之多。他们没有什么正当职业,整天背着剑在外面走来走去,碰到和自己不是一路人的,就免不了要打一架。但大侠们有一个优点就是讲义气,绝对不打自己的朋友。而且他们信奉“朋友的朋友就是我的朋友”,只要是能通过朋友关系串联起来的,不管拐了多少个弯,都认为是自己人。这样一来,江湖上就形成了一个一个的群落,通过两两之间的朋友关系串联起来。而不在同一个群落的人,无论如何都无法通过朋友关系连起来,于是就可以放心往死了打。但是两个原本互不相识的人,如何判断是否属于一个朋友圈呢?
我们可以在每个朋友圈内推举出一个比较有名望的人,作为该圈子的代表人物,这样,每个圈子就可以这样命名“齐达内朋友之队”“罗纳尔多朋友之队”……两人只要互相对一下自己的队长是不是同一个人,就可以确定敌友关系了。
但是还有问题啊,大侠们只知道自己直接的朋友是谁,很多人压根就不认识队长,要判断自己的队长是谁,只能漫无目的的通过朋友的朋友关系问下去:“你是不是队长?你是不是队长?”这样一来,队长面子上挂不住了,而且效率太低,还有可能陷入无限循环中。于是队长下令,重新组队。队内所有人实行分等级制度,形成树状结构,我队长就是根节点,下面分别是二级队员、三级队员。每个人只要记住自己的上级是谁就行了。遇到判断敌友的时候,只要一层层向上问,直到最高层,就可以在短时间内确定队长是谁了。由于我们关心的只是两个人之间是否连通,至于他们是如何连通的,以及每个圈子内部的结构是怎样的,甚至队长是谁,并不重要。所以我们可以放任队长随意重新组队,只要不搞错敌友关系就好了。于是,门派产生了。
下面我们来看并查集的实现。 int pre[1000]; 这个数组,记录了每个大侠的上级是谁。大侠们从1或者0开始编号(依据题意而定),pre[15]=3就表示15号大侠的上级是3号大侠。如果一个人的上级就是他自己,那说明他就是掌门人了,查找到此为止。也有孤家寡人自成一派的,比如欧阳锋,那么他的上级就是他自己。每个人都只认自己的上级。比如胡青牛同学只知道自己的上级是杨左使。张无忌是谁?不认识!要想知道自己的掌门是谁,只能一级级查上去。 find这个函数就是找掌门用的,意义再清楚不过了(路径压缩算法先不论,后面再说)。
//查找我(x)的掌门
int find(vector<int> &parent, int n) {
while (parent[n] != -1) {
n = parent[n];
}
return n;
}
再来看看join函数,就是在两个点之间连一条线,这样一来,原先它们所在的两个板块的所有点就都可以互通了。这在图上很好办,画条线就行了。但我们现在是用并查集来描述武林中的状况的,一共只有一个pre[]数组,该如何实现呢? 还是举江湖的例子,假设现在武林中的形势如图所示。虚竹小和尚与周芷若MM是我非常喜欢的两个人物,他们的终极boss分别是玄慈方丈和灭绝师太,那明显就是两个阵营了。我不希望他们互相打架,就对他俩说:“你们两位拉拉勾,做好朋友吧。”他们看在我的面子上,同意了。这一同意可非同小可,整个少林和峨眉派的人就不能打架了。这么重大的变化,可如何实现呀,要改动多少地方?其实非常简单,我对玄慈方丈说:“大师,麻烦你把你的上级改为灭绝师太吧。这样一来,两派原先的所有人员的终极boss都是师太,那还打个球啊!反正我们关心的只是连通性,门派内部的结构不要紧的。”玄慈一听肯定火大了:“我靠,凭什么是我变成她手下呀,怎么不反过来?我抗议!”抗议无效,上天安排的,最大。反正谁加入谁效果是一样的,我就随手指定了一个。这段函数的意思很明白了吧?
//我想让虚竹和周芷若做朋友
void union(vector<int> &parent, int n, int m) {
//虚竹的老大是玄慈,芷若MM的老大是灭绝
int n_parent = find(parent, n);
int m_parent = find(parent, m);
//玄慈和灭绝显然不是同一个人
if (n_parent != m_parent) {
//方丈只好委委屈屈地当了师太的手下啦
parent[n_parent] = m_parent;
}
//压缩算法
while (n != n_parent) {
int temp = parent[n];
parent[n] = m_parent;
n = temp;
}
}
再来看看路径压缩算法。建立门派的过程是用join函数两个人两个人地连接起来的,谁当谁的手下完全随机。最后的树状结构会变成什么胎唇样,我也完全无法预计,一字长蛇阵也有可能。这样查找的效率就会比较低下。最理想的情况就是所有人的直接上级都是掌门,一共就两级结构,只要找一次就找到掌门了。哪怕不能完全做到,也最好尽量接近。这样就产生了路径压缩算法。 设想这样一个场景:两个互不相识的大侠碰面了,想知道能不能揍。 于是赶紧打电话问自己的上级:“你是不是掌门?” 上级说:“我不是呀,我的上级是谁谁谁,你问问他看看。” 一路问下去,原来两人的最终boss都是东厂曹公公。 “哎呀呀,原来是记己人,西礼西礼,在下三营六组白面葫芦娃!” “幸会幸会,在下九营十八组仙子狗尾巴花!” 两人高高兴兴地手拉手喝酒去了。 “等等等等,两位同学请留步,还有事情没完成呢!”我叫住他俩。 “哦,对了,还要做路径压缩。”两人醒悟。 白面葫芦娃打电话给他的上级六组长:“组长啊,我查过了,其习偶们的掌门是曹公公。不如偶们一起及接拜在曹公公手下吧,省得级别太低,以后查找掌门麻环。” “唔,有道理。” 白面葫芦娃接着打电话给刚才拜访过的三营长……仙子狗尾巴花也做了同样的事情。 这样,查询中所有涉及到的人物都聚集在曹公公的直接领导下。每次查询都做了优化处理,所以整个门派树的层数都会维持在比较低的水平上。路径压缩的代码,看得懂很好,看不懂也没关系,直接抄上用就行了。总之它所实现的功能就是这么个意思。
547.朋友圈
思路
i == j的时候跳过
i != j 的时候, 以一个学生为中心,合并成一个群
int find(vector<int> &parent, int n) {
while (parent[n] != -1) {
n = parent[n];
}
return n;
}
//合并
void Union_f(vector<int> &parent, int n, int m) {
int n_parent = find(parent, n);
int m_parent = find(parent, m);
//如果两者上级不一样,进行合并
if (n_parent != m_parent) {
parent[n_parent] = m_parent;
}
//压缩算法
while (n != n_parent) {
int temp = parent[n];
parent[n] = m_parent;
n = temp;
}
}
int findCircleNum(vector<vector<int>>& M) {
int N = M.size();
vector<int> parent(N, -1);
for (int i = 0; i < N; i++) {
for (int j = 0; j < N; j++) {
if (i != j && M[i][j] == 1) {
Union_f(parent, i, j);
}
}
}
int count=0;
//老大才是-1, 计算多少个-1就是多少个老大
for(int i=0;i < N; ++i)
if(parent[i] == -1)
count++;
return count;
}
684.冗余连接
思路
如果U V已经有共同节点了, 那么就找到了
int find(vector<int> &parent, int n) {
while (parent[n] != -1) {
n = parent[n];
}
return n;
}
vector<int> findRedundantConnection(vector<vector<int>>& edges) {
int N = edges.size();
vector<int> parent(N + 1, -1);
vector<vector<int>> ans;
for (int i = 0; i < N; i++) {
auto edge = edges[i];
int u = find(parent, edge[0]);
int v = find(parent, edge[1]);
//判断是否是共同节点
if (u != v) {
parent[v] = u;
} else {
return edges[i];
}
}
return {0, 0};
}
737.句子相似性II
思路
对于每个paris建立并查集
然后对于words1,2 的对应元素, 直接find查找到上级,如果不相等就是false
string find(unordered_map<string, string> & map, string key) {
if (map.find(key) != map.end()) {
while (key != map[key]) {
key = map[key];
}
}
return key;
}
//上级合并
void UN_ION(vector<string>& vt, unordered_map<string, string> & map) {
string left = find(map, map[vt[0]]);
string right = find(map, map[vt[1]]);
if (left != right) {
map[left] = right;
} else {
return ;
}
string key = vt[0];
string temp;
while (key != left) {
temp = map[key];
map[key] = right;
key = temp;
}
}
bool areSentencesSimilarTwo(vector<string>& words1, vector<string>& words2, vector<vector<string>>& pairs) {
if (words1.size() != words2.size()) {
return false;
}
int words_len = words1.size();
unordered_map<string, string> map;
for (int i = 0; i < words_len; i++) {
map[words1[i]] = words1[i];
map[words2[i]] = words2[i];
}
for (int i = 0; i < pairs.size(); i++) {
UN_ION(pairs[i], map);
}
//查找 如果对应的不同, 那么就是false
for (int i = 0; i < words1.size(); ++i) {
if (find(map, words1[i]) != find(map, words2[i])){
return false;
}
}
return true;
}
1135. 最低成本联通所有城市
思路
首先按照成本从小到大排序
然后N的点需要N-1条边
当边数到N-1就说明已经可以连通了
static bool cmp(vector<int> &a, vector<int> &b) {
return a[2] < b[2];
}
int find_1135(vector<int> &parent, int i) {
while (parent[i] != -1) {
i = parent[i];
}
return i;
}
void union_1135(vector<int> &parent, int i, int j) {
int t_i = find_1135(parent, i);
int t_j = find_1135(parent, j);
if (t_i != t_j) {
parent[t_i] = t_j;
}
int temp;
while (parent[i] != t_j) {
temp = parent[i];
parent[i] = t_j;
i = temp;
}
}
int minimumCost(int N, vector<vector<int>>& connections) {
vector<int> parent(N + 1, -1);
sort(connections.begin(), connections.end(), cmp);
int ans = 0;
int ege = 0;
for (int i = 0 ; i < connections.size(); i++) {
int left = find_1135(parent, connections[i][0]);
int right = find_1135(parent, connections[i][1]);
//头结点不同的情况下,就需要合并
if (left != right) {
union_1135(parent, connections[i][0], connections[i][1]);
ans += connections[i][2];
ege++;
}
if (ege == N - 1) {
break;
}
}
//如果边小于N-1就说明无法连通
if (ege < N - 1) {
return - 1;
}
return ans;
}
261. 以图判树
思路
一个树就一个结点 一个-1
多个-1就表示不是一个结点
int find_261(vector<int> &parent, int i) {
while (parent[i] != -1) {
i = parent[i];
}
return i;
}
void union_261(vector<int> &parent, int i, int j) {
int t_i = find_261(parent, i);
int t_j = find_261(parent, j);
if (t_i != t_j) {
parent[t_i] = t_j;
}
int temp;
while (parent[i] != t_j) {
temp = parent[i];
parent[i] = t_j;
i = temp;
}
}
bool validTree(int n, vector<vector<int>>& edges) {
vector<int> parent(n, -1);
int left;
int right;
for (int i = 0; i < edges.size(); i++) {
left = find_261(parent, edges[i][0]);
right = find_261(parent, edges[i][1]);
if (left == right) {
return false;
}
union_261(parent, left, right);
}
int time = 0;
for (int i = 0; i < parent.size(); i++) {
//判断有多少个root, 一个-1就一个root
if (parent[i] == -1) {
time++;
if (time > 1) {
return false;
}
}
}
return true;
}
1061. 按字典序排列最小的等效字符串
思路
int find_1061(vector<int> &parent, int i) {
while (parent[i] != i) {
i = parent[i];
}
return i;
}
void union_1061(vector<int> &parent, int i, int j) {
int t_i = find_1061(parent, i);
int t_j = find_1061(parent, j);
if (t_i < t_j) {
parent[t_j] = t_i;
parent[j] = t_i;
} else {
parent[t_i] = t_j;
parent[i] = t_j;
}
}
string smallestEquivalentString(string A, string B, string S) {
vector<int> parent(26);
for (int i = 0; i < parent.size(); i++) {
parent[i] = i;
}
int left;
int right;
for (int i = 0; i < A.size(); i++) {
left = A[i] - 'a';
right = B[i] - 'a';
union_1061(parent, left, right);
}
for (int i = 0; i < S.size(); i++) {
int index = S[i] - 'a';
S[i] = find_1061(parent, index) + 'a';
}
return S;
}
323. 无向图中连通分量的数目
思路
直接判断parent有多少个-1
int find(vector<int>& parent, int i) {
while (parent[i] != -1) {
i = parent[i];
}
return i;
}
void union_323(vector<int>& parent, int i, int j) {
int x = find(parent, i);
int y = find(parent, j);
if(x == y) {
return ;
}
parent[y] = x;
int temp;
while (parent[j] != x) {
temp = parent[j];
parent[j] = x;
j = temp;
}
}
int countComponents(int n, vector<vector<int>>& edges) {
vector<int> parent(n, -1);
for (int i = 0; i < edges.size(); i++) {
union_323(parent, edges[i][0], edges[i][1]);
}
int ans = 0;
for (auto nm: parent) {
if (nm == -1) {
ans++;
}
}
return ans;
}