LeetCode面试题 10.02. 变位词组
1.题目
编写一种方法,对字符串数组进行排序,将所有变位词组合在一起。变位词是指字母相同,但排列不同的字符串。
所有输入均为小写字母。
不考虑答案输出的顺序。
示例:
输入: [“eat”, “tea”, “tan”, “ate”, “nat”, “bat”],
输出:
[
[“ate”,“eat”,“tea”],
[“nat”,“tan”],
[“bat”]
]
2.解法
采用hash+字符计数的方式
s含有二十六位字符,每个字符作为字母的计数,“00……00”
s[pos]表示字符pos+‘a’数量
1.遍历输入字符串数组strs
2.对于字符串strs[i]来说,遍历每一个字符,pos=c-‘0’+1,c表示遍历到的字符,+1表示字母计数+1.
3.strs[i]处理完成后,将s作为key,保存字符串位置的数组v作为值,存入map
vector<vector<string>> groupAnagrams(vector<string>& strs) {
int n=strs.size();
if(n==0){
return {};
}
//string 共二十六位,对应位置表示字母数量
//int 表示在str中的位置
unordered_map<string,vector<int>> map;
for(int i=0;i<n;i++){
string s(26,'0');
for(char c : strs[i]){
int pos=c-'a';
s[pos]+=1;
}
map[s].push_back(i);
}
vector<vector<string>> ans;
for(auto it = map.begin();it != map.end();it++){
vector<string> v;
for(auto i : it->second){
v.push_back(strs[i]);
}
ans.push_back(move(v));
}
return ans;
}
一些问题
改进
字符串中重复字符超过十个时,string不能再作为key值。改用vector或定长数组作为key值。
用到的数据结构
unordered_map<key,value> map
std::map使用红黑树作为底层实现,内部的元素是有序的,对需要顺序要求的问题效率更高,但查找效率为logn。
std::unordered_map采用hash表作为底层实现,内部元素无序,查找效率为常数时间。
额外的:
std中的数据结构都是线程不安全的,多线程读没问题,一旦多线程读写,就会发生错误,比如迭代器失效,不可重复读(正在读时数据已被修改)、幻读(插入数据相关)
在多线程情景下,需要使用锁使其同步,简单的解决方案是对整个数据加锁,但是效率不高,一种优化的解决方案,例如对map来说,分块加锁提升效率。
参考数据库中,的行级锁与表级锁,行级锁并发度更高。