难度: 中等
题目描述
给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。
示例:
输入: ["eat", "tea", "tan", "ate", "nat", "bat"],
输出:
[
["ate","eat","tea"],
["nat","tan"],
["bat"]
]
说明:
+ 所有输入均为小写字母。
+ 不考虑答案输出的顺序。
思路
包含的字母相同,但是排列可以不同的字符串实际上就代表一个可重集,题目要求把代表同一个可重集的字符串放到一个列表中,可以用unordered_map记录可重集对应的列表的编号,这就涉及到如何计算可重集的key,注意到实际上每个正整数就能够代表一个独特的可重集——质因数分解。但是这个整数很可能会很大,所以使用一个较大的素数对结果取模,比如说1e8+7。
代码
class Solution {
public:
static const size_t MOD = 100000007;
static constexpr array<int, 26> primes{2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101};
static array<int, 26> feature(const string &s) {
array<int, 26> f{};
for (auto &i : s) f[i - 'a']++;
return f;
}
struct equal_to {
bool operator()(const string &a, const string &b) const {
return feature(a) == feature(b);
}
};
struct hash {
size_t operator()(const string &s) const {
size_t key = 1;
for (auto &i : s)
key = (key * primes[i - 'a']) % MOD;
return key;
}
};
vector<vector<string>> groupAnagrams(vector<string> &strs) {
vector<vector<string>> ans;
unordered_map<string, int, hash, equal_to> str2index;
for (auto &str : strs)
if (str2index.count(str)) {
ans[str2index[str]].push_back(str);
} else {
str2index[str] = ans.size();
ans.emplace_back(vector<string>{str});
}
return ans;
}
};