题意
给1e5组数字(1~1e9),每组数字二选一,问最多可以选择多少种数字.
分析
简单!dfs
错了,应该是贪心
(是自己的思路十分波折,分析内容可以跳过不看)
开始的想法是在贪心的基础上用队列记录可以替代的选择。
我先拿了x,放弃了y,但是我把y加入了que[x]的队列中,下一次我拿到x的时候就可以去换y了。
但是由于每种数字只拿一次(多拿没有意义)所以实际上只会有一个因为x放弃的数字y,那么队列就不需要了,只用数组即可。
但是这种想法会因为贪心的选择x或者y导致传递方向的问题,但是方向转向了并查集。
结论
把每个出现过的数字当成一个集合,每个集合中的所有数字,最多只有一个还没有被选中。
此时给出两个数字
如果数字在相同集合中,那么这个集合必然已经全部选中,打上标记。
如果数字在不同集合中,从中选一个,那么必定有一个集合会全部选中,所以可以把两个集合合并。
如果合并之前已经有集合有标记,则合并后的集合一定也是全部选中的,所以传递标记。
(全部选中很口语,从图论上来说就是这一个集合内部有环)
最后的答案 ans = n - 没有打上标记的集合数。
(由于数字的范围很大,但是个数只有2e5,所以得离散化)
代码
#include<bits/stdc++.h>
using namespace std;
const int maxn = 2e5 + 5;
int data[maxn];
int a[maxn];
map<int,int>mp;
bool vis[maxn];
int fa[maxn];
int find(int x){
if(fa[x] == x)return x;
return fa[x] = find(fa[x]);
}
int main(){
int T;
scanf("%d",&T);
for(int cas = 1 ; cas <= T ; cas++){
memset(vis, 0, sizeof vis);
mp.clear();
//读取数据
int n;scanf("%d",&n);
for(int i = 0 ; i < n ; i++){
scanf("%d%d",&data[i*2],&data[i*2 + 1]);
a[i * 2] = data[i*2]; a[i*2+1] = data[i*2+1];
}
//离散化
sort(data,data + 2 * n);
int size = unique(data, data + 2 * n) - data;
for(int i = 0 ; i < size ; i++){
mp[data[i]] = i;
fa[i] = i;
}
//连边
int u, v;
for(int i = 0 ; i < n ; i++){
u = find(mp[a[i*2]]);
v = find(mp[a[i*2+1]]);
if(u == v)vis[u] = 1;
else{
fa[v] = u;
vis[u] |= vis[v];
}
}
int ans = size;
for(int i = 0 ; i < size ; i++){
if(find(i) == i && !vis[i])ans--;
}
printf("Case #%d: %d\n",cas,ans);
}
}