字母异位词分组
leetcode 49:字母异位词分组
给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。
示例:
输入: ["eat", "tea", "tan", "ate", "nat", "bat"]
输出:
[
["ate","eat","tea"],
["nat","tan"],
["bat"]
]
哈希表
本题的关键在于如何找到映射关系,可以对字符串进行排序并使用排序后的字符串(元组)作为键(异位词相同的特征),键值就是所有分组的结果。
注意:不能使用可变的数据类型,如列表做为键。
from collections import defaultdict
def groupAnagrams(self, strs: List[str]) -> List[List[str]]:
dic = defaultdict(list)
for s in strs:
dic[tuple(sorted(s))].append(s)
# dic[tuple(sorted(s))] = dic.get(tuple(sorted(s)), []) + [s] # 不使用 defaultdic,要这样写
return list(dic.values()) # 提取 value 值
扩展:defaultdict
的用法
使用 dict
时,如果引用的 Key
不存在,就会抛出 KeyError
。如果希望 key
不存在时,返回一个默认值,就可以用 collections.defaultdict
。
defaultdict
接受一个工厂函数作为参数:
dict = defaultdict(default_factory)
工厂函数:工厂函数用于创建某种类型的新的数据项。例加,
set()
就是一个工厂函数。
因为它会创建一个新的集合。在真实世界中,工厂会生产产品,这个概念因此而得名。
—— head first Python
这个 default_factory 可以是 list、set、str、dict、int、float 等等,作用是当 key 不存在时,返回的工厂函数的默认值,比如 list 对应 []
,str 对应 ''
,set 对应 set()
,int 对应 0
,float 对应 0.0
等等。
使用 defaultdict
能极大减少代码量。