【LeetCode】Anagram

最新推荐文章于 2018-11-15 00:17:23 发布

weixin_30530523

最新推荐文章于 2018-11-15 00:17:23 发布

阅读量101

点赞数

文章标签：数据结构与算法

原文链接：http://www.cnblogs.com/wayne793377164/p/7233094.html

版权

Anagram 指由颠倒字母顺序而构成的单词。

e.g. 给出 ["eat", "tea", "tan", "ate", "nat", "bat"]，假设所给单词仅由小写字母组成。

[
["ate", "eat","tea"],
["nat","tan"],
["bat"]
]

我的算法原理是 key - value，但不会使用 map，所以效率极低。

 1 vector<vector<string>> groupAnagrams(vector<string>& strs) {
 2     vector<vector<string>> result;
 3     vector<string> key;
 4     for (string str : strs) {
 5         string s = str;
 6         sort(s.begin(), s.end());
 7         vector<string>::iterator it = find(key.begin(), key.end(), s);
 8         if (it == key.end()) {
 9             key.push_back(s);
10             result.push_back({str});
11         } else {
12             result[it - key.begin()].push_back(str);
13         }
14     }
15     return result;
16 }

看到别人一种算法原理和我完全一样，但使用了 unordered_map 和 multiset，效率大大提高。

unordered_map 不会根据 key 的大小进行排序，存储时是根据 key 的 hash 值判断元素是否相同。因此如果存放自定义类型，那么就需要重载 operator== 以及 hash_value 函数。

multiset 是 <set> 库中一个非常有用的类型。set 的特性是所有元素都会根据值自动排序；set 不允许两个元素拥有相同的值；不能通过迭代器修改 set 元素的值。

set 和 multiset 都是基于红黑树实现的，因此元素在插入 / 删除的过程中就实现了排序，不同的是后者允许元素重复而前者不允许。

 1 vector<vector<string>> groupAnagrams(vector<string>& strs) {
 2     unordered_map<string, multiset<string>> mp;
 3     for (string s : strs) {
 4         string t = s; 
 5         sort(t.begin(), t.end());
 6         mp[t].insert(s);
 7     }
 8     vector<vector<string>> anagrams;
 9     for (auto m : mp) { 
10         vector<string> anagram(m.second.begin(), m.second.end());
11         anagrams.push_back(anagram);
12     }
13     return anagrams;
14 }

由于条件 “所给单词仅由小写字母组成”，将 O(nlogn) 的 sort 换成基于 counting sort （O(n)时间）的排序函数，也会提高一定效率。

 1 vector<vector<string>> groupAnagrams(vector<string>& strs) {
 2     ...
 3     string t = strSort(s);
 4     ...
 5 }
 6 
 7 string strSort(string& s) {
 8     int count[26] = {0}, n = s.length();
 9     for (int i = 0; i < n; i++)
10         count[s[i] - 'a']++;
11     int p = 0;
12     string t(n, 'a');
13     for (int j = 0; j < 26; j++)
14         for (int i = 0; i < count[j]; i++)
15             t[p++] += j;
16     return t;
17 }