Python中collections.defaultdict()使用

关于Python collections.defaultdict()与dict的使用和区别
collections.defaultdict()的用法和同普通dict的区别以及示例

DICT.SETDEFAULT()
​ 在说明collections.defaultdict()之前,我们首先要提一下setdefault()方法。

​ Python 字典 setdefault() 函数和get()方法类似, 如果键不存在于字典中,将会添加键并将值设为默认值。

dict.setdefault(key, default=None)
key – 查找的键值
default – 键不存在时,需要设置的默认值
返回值:如果字典中包含有给定键,则返回该键对应的值,否则返回为该键设置的值。
>>> dict = {'name':'Alex','age':23}
>>> print("Value : %s" %dict.setdefault('name',None))
Value : Alex
>>> print("Value : %s" %dict.setdefault('sex','man'))
Value : man
>>> dict
{'name': 'Alex', 'age': 23, 'sex': 'man'}
##collections.defaultdict()

Python中通过Key访问字典,当Key不存在时,会引发‘KeyError’异常。为了避免这种情况的发生,可以使用collections类中的defaultdict()方法来为字典提供默认值。

语法格式:

1
collections.defaultdict([default_factory[,]])
该函数返回一个类似字典的对象。defaultdict是Python内建字典类(dict)的一个子类,它重写了方法 missing(key),增加了一个可写的实例变量default_factory,实例变量default_factory被missing()方法使用,如果该变量存在,则用以初始化构造器,如果没有,则为None。其它的功能和dict一样。

第一个参数为default_factory属性提供初始值,默认为None;其余参数包括关键字参数(keyword arguments)的用法,和dict构造器用法一样。

list
​ 使用list作第一个参数,可以很容易将键-值对序列转换为列表字典。collections.defaultdict(list)使用起来效果和我们上面提到的dict.setdefault()比较相似,这种方法会和dict.setdefault()等价,但是要更快。

from collections import defaultdict
s=[('yellow',1),('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d=defaultdict(list)
for k, v in s:
    d[k].append(v)
a=sorted(d.items())
print(a)
运行结果为

1
[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]
当字典中没有的键第一次出现时,default_factory自动为其返回一个空列表,list.append()会将值添加进新列表;再次遇到相同的键时,list.append()将其它值再添加进该列表。

dict.setdefault()的用法:

s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d={}
for k, v in s:
    d.setdefault(k,[]).append(v)
print('\n',d)
a=sorted(d.items())
print('\n',a)
运行结果:


{'yellow': [1, 3], 'blue': [2, 4], 'red': [1]}

[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]
int
将default_factory设为int时,可以被用来计数

defaultdict(int) 这里的d其实是生成了一个默认为0的带key的数据字典。你可以想象成 d[key] = int default ,d[k]所以可以直接读取 d[“m”] += 1 就是d[“m”] 就是默认值 0+1 = 1


from collections import defaultdict
s = 'mississippi'
d = defaultdict(int)
for k in s:
    d[k] += 1
print('\n',d)
a=sorted(d.items())
print('\n',a)
结果:

defaultdict(<class 'int'>, {'m': 1, 'i': 4, 's': 4, 'p': 2})

[('i', 4), ('m', 1), ('p', 2), ('s', 4)]
字符串中的字母第一次出现时,字典中没有该字母,default_factory函数调用int()为其提供一个默认值0,加法操作将计算出每个字母出现的次数。

set
default_factory设为set时,可以用defaultdict建立集合字典(a dictionary of sets)。
from collections import defaultdict
s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]
d = defaultdict(set)
for k, v in s:
    d[k].add(v)
print('\n',d)
a=sorted(d.items())
print('\n',a)
运行结果:

1
2
3
defaultdict(<class 'set'>, {'red': {1, 3}, 'blue': {2, 4}})

[('blue', {2, 4}), ('red', {1, 3})]

Python中collections.defaultdict()使用

FromNow
1
2017.05.09 14:23:22
字数 310
阅读 35,696
1、以一个例子开始:统计一个列表里各单词重复次数

words = ['hello', 'world', 'nice', 'world']
counter = dict()
for kw in words:
    counter[kw] += 1
这样写肯定会报错的,因为各词的个数都没有初始值,引发KeyError
2、改进一下:加入if判断

words = ['hello', 'world', 'nice', 'world']
counter = dict()
for kw in words:
    if kw in words:
        counter[kw] += 1
    else:
        counter[kw] = 0
3、再改进:使用setdefault()方法设置默认值

words = ['hello', 'world', 'nice', 'world']
counter = dict()
for kw in words:
    counter.setdefault(kw, 0)
    counter[kw] += 1
setdefault(),需提供两个参数,第一个参数是键值,第二个参数是默认值,每次调用都有一个返回值,如果字典中不存在该键则返回默认值,如果存在该键则返回该值,利用返回值可再次修改代码。

words = ['hello', 'world', 'nice', 'world']
counter = dict()
for kw in words:
    counter[kw] = counter.setdefault(kw, 0) + 1
4、接着改进
一种特殊类型的字典本身就保存了默认值defaultdict(),defaultdict类的初始化函数接受一个类型作为参数,当所访问的键不存在的时候,可以实例化一个值作为默认值。

from collections import defaultdict
dd = defaultdict(list)
defaultdict(<type 'list'>, {})
#给它赋值,同时也是读取
dd['h'h]
defaultdict(<type 'list'>, {'hh': []})
dd['hh'].append('haha')
defaultdict(<type 'list'>, {'hh': ['haha']})
该类除了接受类型名称作为初始化函数的参数之外,还可以使用任何不带参数的可调用函数,到时该函数的返回结果作为默认值,这样使得默认值的取值更加灵活。

>>> from collections import defaultdict
>>> def zero():
...     return 0
...
>>> dd = defaultdict(zero)
>>> dd
defaultdict(<function zero at 0xb7ed2684>, {})
>>> dd['foo']
0
>>> dd
defaultdict(<function zero at 0xb7ed2684>, {'foo': 0})
最终代码:

from collections import defaultdict
words = ['hello', 'world', 'nice', 'world']
#使用lambda来定义简单的函数
counter = defaultdict(lambda: 0) 
for kw in words:
    counter[kw] += 1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值