给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。
示例:
输入: ["eat", "tea", "tan", "ate", "nat", "bat"]
输出:
[
["ate","eat","tea"],
["nat","tan"],
["bat"]
]
哈希表:
class Solution(object):
def groupAnagrams(self, strs):
"""
:type strs: List[str]
:rtype: List[List[str]]
"""
dic = {}
for string in strs:
key = tuple(sorted(string))
dic[key] = dic.get(key, []) + [string]
return list(dic.values())
我们可以先把字符串排序一下,然后将其作为哈希表的键保存起来。当下次出现与之相同的排序完的字符串,可以直接存放在哈希表中。所以我们最后的时间复杂度为O(NKlogK),因为遍历一遍所有的字符串需要O(N)的时间,而排序需要O(KlogK)的时间,K为字符串的最大长度。
哈希表2:
class Solution:
def groupAnagrams(strs):
ans = collections.defaultdict(list)
for s in strs:
count = [0] * 26
for c in s:
count[ord(c) - ord('a')] += 1
ans[tuple(count)].append(s)
return ans.values()
我们可以把字符串用另一种方式来表示,由于该问题只需要两个字符串具有相同数量的元素即可,那么我们可以把字符串转化为一个长度为26的计数器分别对应a到z字符出现的次数。最后将这个tuple直接作为哈希表的Key来使用。对比上一个方法不需要对字符串再进行排序,可以节省更多的时间。注意到这里用到了collections.defaultdict()方法,该方法可以为我们的字典设置默认值。这里为设置一个空的list。这种写法不需要在判断key是否在字典中存在,需要掌握。 此外这里还用到了系统的ord()方法,它可以将一个字符转化为ASCll码的十进制表示。