defaultdict的使用
假如需要对一个dict中的元素做统计
1、一般最先想到的下列方法
users = ['ha1', 'ha2', 'ha1', 'ha3', 'ha2']
for user in users:
if user not in user_dict.keys():
user_dict[user] = 1
else:
user_dict[user] += 1
print(user_dict)
2、python 中内置的setdefault()方法,比上面的方法性能高,因为少做了一次查询user_dict操作,可以给定dict初始值,不会报keyerror异常。
user_dict = {}
users = ['ha1', 'ha2', 'ha1', 'ha3', 'ha2']
for user in users:
user_dict.setdefault(user, 0)
user_dict[user] += 1
print(user_dict)
3、使用defaultdict,在dict中key不存在的时候会添加key,在使用defaultdict对时需要传递一个对象,可以是list、set、str等等,作用是当key不存在时,返回的是工厂函数的默认值,比如list对应[ ],str对应的是空字符串,set对应set( ),int对应0,也可以时自定义的类。
from collections import defaultdict
default_dict = defaultdict(int) # 需要传递一个对象,用于默认生成
users = ['ha1', 'ha2', 'ha1', 'ha3', 'ha2']
for user in users:
default_dict[user] += 1
print(default_dict)
如下列代码,可初始化复杂的dict
def gen_default():
return {
'name':'',
'nums':0
}
default_dict=defaultdict(gen_default)
default_dict['group1']
for key,values in default_dict.items():
print(key,values)