题目
给你一个下标从 0 开始的字符串数组 words 。每个字符串都只包含 小写英文字母 。words 中任意一个子串中,每个字母都至多只出现一次。
如果通过以下操作之一,我们可以从 s1 的字母集合得到 s2 的字母集合,那么我们称这两个字符串为 关联的 :
往 s1 的字母集合中添加一个字母。
从 s1 的字母集合中删去一个字母。
将 s1 中的一个字母替换成另外任意一个字母(也可以替换为这个字母本身)。
数组 words 可以分为一个或者多个无交集的 组 。一个字符串与一个组如果满足以下 任一 条件,它就属于这个组:
它与组内 至少 一个其他字符串关联。
它是这个组中 唯一 的字符串。
注意,你需要确保分好组后,一个组内的任一字符串与其他组的字符串都不关联。可以证明在这个条件下,分组方案是唯一的。
请你返回一个长度为 2 的数组 ans :
ans[0] 是 words 分组后的 总组数 。
ans[1] 是字符串数目最多的组所包含的字符串数目。
提示:
1 <= words.length <= 2 * 104
1 <= words[i].length <= 26
words[i] 只包含小写英文字母。
words[i] 中每个字母最多只出现一次。
示例:
输入:words = ["a","b","ab","cde"]
输出:[2,3]
解释:
- words[0] 可以得到 words[1] (将 'a' 替换为 'b')和 words[2] (添加 'b')。所以 words[0] 与 words[1] 和 words[2] 关联。
- words[1] 可以得到 words[0] (将 'b' 替换为 'a')和 words[2] (添加 'a')。所以 words[1] 与 words[0] 和 words[2] 关联。
- words[2] 可以得到 words[0] (删去 'b')和 words[1] (删去 'a')。所以 words[2] 与 words[0] 和 words[1] 关联。
- words[3] 与 words 中其他字符串都不关联。
所以,words 可以分成 2 个组 ["a","b","ab"] 和 ["cde"] 。最大的组大小为 3 。
思路
由words.length和words[i].length范围,就算把每个字符串所有关联情况都枚举一遍,也不会超时,因此我们此题采用枚举法。
其次,枚举所有可能性时需要与现有的字符串数组进行比较,而数组中每个字符串的每个字母只会出现一次,因此我们可以进行状态压缩。将对于每个字符串,最多有26个不同字母,我们可以转化为26位二进制数,字母存在该位标为1,不存在标为0。
同时,我们需要对关联的字符串划分到一组内,此时可以采用并查集。原理是建立一个哈希表,对于字符串状态压缩产生的二进制对应到哈希表key值,其value值则为组号。刚开始可以每个字符串一组,通过迭代字符串,将其value指向关联字符串下标,实现了组的合并。
方法:枚举+状态压缩+并查集
- 建立一个哈希表存储每个字符串组,并遍历数组依次存入(此时每个字符串一个组,可以将value值设为本字符串下标索引)
- 遍历哈希表,对于每个字符串,依次枚举出每种关联可能性。
- 对于每种可能关联的字符串:如果在哈希表中不存在,进行下一个枚举;如果和原字符串在一个组内,进行下一个枚举;如果不在一个组内,将关联字符串和原字符合到一个组内,再继续枚举。
- 查找字符串组号:如果该哈希表中该字符串位置的value值与key值相同,则value为组号;否则,查找key为当前value的哈希映射。
代码
class Solution {
public:
unordered_map<int, int> f, size;
int maxx=0;
int len;
vector<int> groupStrings(vector<string>& words) {
len = words.size();
for(auto &w:words){
int x = 0;
for(auto ch:w)
x |= 1<<(ch-'a');
f[x] = x;
size[x]++;
maxx = max(maxx, size[x]);
if(size[x]>1) len--;
}
for(auto &[x,_]:f){
for(int i=0;i<26;i++){
compare(x, x^(1<<i)); //添加\删除元素
if((x>>i)&1){
for(int j=0;j<26;j++){
if(((x>>j)&1)==0){
compare(x, x^(1<<i)|(1<<j)); //替换元素
}
}
}
}
}
return {len, maxx};
}
void compare(int x, int y){
if(!f.count(y)) return ; //不存在这个字符串
x = find(x);
y = find(y);
if(x==y) return; //是同一个组
f[y] = x;
size[x]+=size[y];
maxx = max(maxx, size[x]);
len--;
}
int find(int x){
return f[x]==x ? x:f[x]=find(f[x]);
}
};