字母异位词分组：defaultdict 的妙用

最新推荐文章于 2021-07-24 22:45:12 发布

山水如初

最新推荐文章于 2021-07-24 22:45:12 发布

阅读量180

点赞数 1

分类专栏： leetcode 文章标签：字符串 python 哈希列表

本文链接：https://blog.csdn.net/weixin_43932942/article/details/108236555

版权

leetcode 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

字母异位词分组

leetcode 49：字母异位词分组

给定一个字符串数组，将字母异位词组合在一起。字母异位词指字母相同，但排列不同的字符串。

示例：

输入: ["eat", "tea", "tan", "ate", "nat", "bat"]
输出:
[
  ["ate","eat","tea"],
  ["nat","tan"],
  ["bat"]
]

哈希表

本题的关键在于如何找到映射关系，可以对字符串进行排序并使用排序后的字符串（元组）作为键（异位词相同的特征），键值就是所有分组的结果。

注意：不能使用可变的数据类型，如列表做为键。

from collections import defaultdict

def groupAnagrams(self, strs: List[str]) -> List[List[str]]:
    dic = defaultdict(list)
    for s in strs:
        dic[tuple(sorted(s))].append(s)
        # dic[tuple(sorted(s))] = dic.get(tuple(sorted(s)), []) + [s]  # 不使用 defaultdic，要这样写
    return list(dic.values())  # 提取 value 值

扩展：`defaultdict` 的用法

使用 dict 时，如果引用的 Key 不存在，就会抛出 KeyError。如果希望 key 不存在时，返回一个默认值，就可以用 collections.defaultdict。

defaultdict 接受一个工厂函数作为参数：

dict = defaultdict(default_factory)

工厂函数：工厂函数用于创建某种类型的新的数据项。例加，set() 就是一个工厂函数。
因为它会创建一个新的集合。在真实世界中，工厂会生产产品，这个概念因此而得名。
—— head first Python

这个 default_factory 可以是 list、set、str、dict、int、float 等等，作用是当 key 不存在时，返回的工厂函数的默认值，比如 list 对应 []，str 对应 ''，set 对应 set()，int 对应 0，float 对应 0.0 等等。

使用 defaultdict 能极大减少代码量。