这里我们来简介Python的collections模块中defaultdict类型的用法,与内置的字典类最大的不同在于初始化上,一起来看一下:
defaultdict 主要用来需要对 value 做初始化的情形。对于字典来说,key 必须是 hashable,immutable,unique 的数据,而 value 可以是任意的数据类型。如果 value 是 list,dict 等数据类型,在使用之前必须初始化为空,有些情况需要把 value 初始化为特殊值,比如 0 或者 ‘‘。
from collections import defaultdict person_by_age = defaultdict(list) for person in persons: d[person.age].append(person.name)
defaultdict 和 dict 的使用方法一样,只有在初始化的时候必须传入一个 callable 的对象 x,当访问某个还不存在的 key 时,会把 value 自动设置成 x()。比如上例中,当第一次访问某个年龄的人 d[person.age] 就会变成 list(), 也就是 []。
当然也可以使用自己定义的 callable 对象,比如:
d = defaultdict(lambda: 0)
d["hello"] += 1 # 1
d["a"] # 0
defaultdict 要比 dict.set_default 效率更高,使用起来也更直观和方便。
标准字典包括一个方法setdefault()来获取一个值,如果值不存在则建立一个默认值。defaultdict初始化容器是会让调用者提前指定默认值。
import collections def default_factory(): return 'default value' d = collections.defaultdict(default_factory, foo = 'bar') print 'd:', d print 'foo =>', d['foo'] print 'var =>', d['bar']
只要所有键都有相同的默认值,就可以使用这个方法。
上面的结果是:
d: defaultdict(<function default_factory at 0x0201FAB0>, {'foo': 'bar'})
foo => bar
var => default value
其他实例
1 #dic1 = {}
2 #dic1["k1"].append("kkkkk") #正常情况会报错 3 #print(dic1) 4 5 import collections 6 dic = collections.defaultdict(list) #指定字典的值为列表 7 dic["k1"].append("kkkkk") 8 print(dic) 9 10 #执行结果: 11 defaultdict(<class 'list'>, {'k1': ['kkkkk']})
1 #有如下值集合,不用默认字典执行代码如下
2 #[11,22,33,44,55,66,77,88,99,90] 3 #将所有大于66的值保存在字典的第一个key中, 4 #将小于等于66的值保存在第二个key的值(列表)中。 5 #即:{"k1":大于66,"k2":小于等于66} 6 7 li = [11,22,33,44,55,66,77,88,99,90] 8 dic = {} 9 10 for i in li: 11 if i>66: 12 if "k1" in dic.keys(): 13 dic["k1"].append(i) 14 else: 15 dic["k1"] = [i,] 16 else: 17 if "k2" in dic.keys(): 18 dic["k2"].append(i) 19 else: 20 dic["k2"] = [i,] 21 print(dic) 22 23 #执行结果: 24 {'k2': [11, 22, 33, 44, 55, 66], 'k1': [77, 88, 99, 90]}
1 #用默认字典精简代码
2 from collections import defaultdict #这样写,下面就不用写collections.defaultdict了 3 values = [11, 22, 33,44,55,66,77,88,99,90] 4 my_dict = defaultdict(list) 5 6 for value in values: 7 if value>66: 8 my_dict['k1'].append(value) 9 else: 10 my_dict['k2'].append(value) 11 print(my_dict) 12 13 #执行结果: 14 defaultdict(<class 'list'>, {'k2': [11, 22, 33, 44, 55, 66], 'k1': [77, 88, 99, 90]})