collections.
defaultdict
([default_factory[, ...]])
返回一个新的类似字典的对象。 defaultdict
是内置 dict
类的子类,它重载了一个方法并添加了一个可写的实例变量。
第一个参数 default_factory
提供了一个初始值。它默认为 None
。所有的其他参数都等同与 dict
构建器中的参数对待,包括关键词参数。
- 使用
list
作为default_factory
,很容易将序列作为键值对加入字典:
s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d = defaultdict(list)
for k, v in s:
d[k].append(v)
sorted(d.items())
out:[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]
当字典中没有的键第一次出现时,default_factory自动为其返回一个空列表,list.append()会将值添加进新列表;再次遇到相同的键时,list.append()将其它值再添加进该列表。
- 设置
default_factory
为int
,使defaultdict
在计数方面发挥好的作用,设置default_factory
为(lambda: 0) 也可以实现计数操作
s = 'mississippi'
d = defaultdict(int)
for k in s:
d[k] += 1
sorted(d.items())
out: [('i', 4), ('m', 1), ('p', 2), ('s', 4)]
当一个字母首次遇到时,它就查询失败,所以 default_factory
调用 int()
来提供一个整数0作为默认值。自增操作然后建立对每个字母的计数。
函数 int()
总是返回0,是常数函数的特殊情况。一个更快和灵活的方法是使用lambda函数,可以提供任何常量值(不只是0):
s = 'mississippi'
d = defaultdict(lambda: 0)
for k in s:
d[k] += 1
sorted(d.items())
out: [('i', 4), ('m', 1), ('p', 2), ('s', 4)]
- 设置
default_factory
为set
使defaultdict
用于构建字典集合:
s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]
d = defaultdict(set)
for k, v in s:
d[k].add(v)
sorted(d.items())
out: [('blue', {2, 4}), ('red', {1, 3})]