leetcode49. 字母异位词分组
题目:给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。
输入: [“eat”, “tea”, “tan”, “ate”, “nat”, “bat”],
输出:
[
[“ate”,“eat”,“tea”],
[“nat”,“tan”],
[“bat”]
]
说明:所有输入均为小写字母; 不考虑答案输出的顺序。
思路:
用map的键存排完序的字符串,值是一个数组,数组存满足这个键的所有字符串。
1.原始排序,没有优化 C++版
vector<vector<string>> groupAnagrams(vector<string>& strs) {
unordered_map<string, vector<string>> mp;
for (string s : strs) {
string t = s;
sort(t.begin(), t.end());//给字符串排序,把异位词变成唯一字符串
mp[t].push_back(s);//唯一字符串的值是数组,加入这个排序前的字符串
}
vector<vector<string>> anagrams;
for (auto p : mp) {
anagrams.push_back(p.second);
}
return anagrams;
}
2.排序优化 (利用hash)
因为都是小写字母,可以用hash表0-25代表26个小写字母,统计每个字符串的字符出现次数然后根据出现次数,从a-z的顺序重新生成字符串,那么异味词就和上面排序一样,统一成唯一字符串了。
C++版:
vector<vector<string>> groupAnagrams(vector<string>& strs) {
vector<vector<string>> ans;
unordered_map<string, vector<string>> umap;
for (string s: strs) {
//只要s不是空,返回的strSorted就不是"";
umap[strSort(s)].push_back(s);
}
for (auto strKey : umap) {
ans.push_back(strKey.second);
}
return ans;
}
string strSort(string s) {
int charCount[26] = {0};
for (char c : s) {
charCount[c - 'a']++;
}
string sortedStr = "";
for (int i = 0; i < 26; ++i) {
//string(count, char) 生成字符串s:char出现count次
sortedStr += string(charCount[i], i + 'a');
}
return sortedStr;
}
方法2的Java版本:
public List<List<String>> groupAnagrams(String[] strs) {
List<List<String>> ans = new ArrayList<List<String>>();
Map<String, List<String>> map = new HashMap<>();
for (String str : strs) {
String strSorted = mySort(str); // 获取排完序的字符串
if (!map.containsKey(strSorted)) {
map.put(strSorted, new ArrayList<>());
}
// str 加入到strSorted 为key的list中去
map.get(strSorted).add(str);
}
// 将map中所有value 加入 ans
for(List<String> list : map.values())
ans.add(list);
return ans;
}
String mySort(String str) {
int[] hash = new int[26];
for (char ch : str.toCharArray()) // 统计字符串次数
hash[ch - 'a']++;
String strSorted = "";
for (int i = 0; i < 26; ++i) { // 重新生成字符串
while (hash[i]-- > 0) strSorted += i + 'a';
}
return strSorted;
}