字母异位词分组
题目
给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。
示例:
输入: [“eat”, “tea”, “tan”, “ate”, “nat”, “bat”],
输出:
[
[“ate”,“eat”,“tea”],
[“nat”,“tan”],
[“bat”]
]
说明:
所有输入均为小写字母。 不考虑答案输出的顺序。
填补下面函数
vector<vector<string>> groupAnagrams(vector<string>& strs) {
}
思路
1、如何判断一样
首先抓住最重要的一点,我们的分类标准——字母组成一样的单词分为一类。
如何判断单词组成一样呢?一个最简单的办法——排序
如果排序之后的单词一样,那么字母组成便是一样的
2、如何快速得知某类已经存在
关于快速,我们很容易想到一个数据结构——哈希表
是否存在呢?哈希一下就知道了
那么我们的hash表中存储的索引是排序后的单词,值为结果vector (命名为res)的下标,至于为什么要这样,下面再说。
这样我们就能迅速的进行分类了
3、如何将同一类的单词放入同一个地方(结果vector的同一下标处)。
这便是上面为何要在哈希表中存储vector的下标了。
同一类的单词,对应着同一个下标,只要通过下标索引到同一个位置就可以存储起来了。
算法过程
1、遍历数组
2、对于每一个单词,排序后存入临时字符串tmp中
3、判断hash表中是否有tmp的索引:
若没有,将下标sub作为值,tmp作为索引,存入hash表中,将为排序前的单词存入结果vector中;
若有,则读取对应的下标,将未排序前的单词存入结果vector中。
这样遍历一遍,便可以得到最后的结果vector了
代码
vector<vector<string>> res;
int sub=0; //结果vector的下标值
string tmp; //临时string
unordered_map<string,int> work; //判断排序后单词是否存在,即字母组成是否一致
for(auto str:strs)
{
tmp=str;
sort(tmp.begin(),tmp.end());
if(work.count(tmp))
{
res[work[tmp]].push_back(str);
}
else
{
vector<string> vec(1,str);
res.push_back(vec);
work[tmp]=sub++;
}
}
return res;
——————————————————————————————————————————————————————————
题目来源:Leetcode