Python中的defaultdict方法

python中的dict是一个重要的数据类型,知道如何使用这个数据类型很简单,但是这个类型使用过程中容易进入一些误区,这篇文章主要对defaultdict方法的讲解,深入的了解dict数据类型。

字典(dictionary)数据类型,不同于其他由数字索引的序列,字典是用”键”(key)来索引的。通常表示为dict(key: val, …),有以下特征:

  • 键可以是任何不可变(immutable)数据类型(不可变数据类型:数字,字符串、元组)(也就是说key不能为列表和字典类型)
  • 每个键必须是唯一的
  • 字典中每一项的顺序是任意的

1,collections.defaultdict类的介绍:
defaultdict是Python内建dict类的一个子类,第一个参数为default_factory属性提供初始值,默认为None。它覆盖一个方法并添加一个可写实例变量。它的其他功能与dict相同,但会为一个不存在的键提供默认值,从而避免KeyError异常。

2,一般的dict类型会导致KeyError异常:
一般dict类型:

dict1 = {'Alice': '2341', 'Beth': '9102', 'Cecil': '3258'}
dict2 = {'abc': 456};
dict3 = {'abc': 123, 10: 20};
dict4 = {} #定义空字典
dict5 = dict() #定义空字典

KeyError异常:

bag = ['apple', 'orange', 'cherry', 'apple','apple', 'cherry', 'blueberry']
count = {}
for fruit in bag:
    count[fruit] += 1

错误:
KeyError: 'apple'

defaultdict类避免KeyError异常:

import collections
bag = ['apple', 'orange', 'cherry', 'apple','apple', 'cherry', 'blueberry']
count = collections.defaultdict(int)
for fruit in bag:
    count[fruit] += 1

输出:
defaultdict(<class 'int'>, {'apple': 3, 'orange': 1, 'cherry': 2, 'blueberry': 1})

3,collections.defaultdict类使用:
类型名称作为初始化函数参数:这个就是上面的例子
可调用函数作为初始化函数参数:

import collections
def zero():
    return 0
dic = collections.defaultdict(zero)
dic['bbb']
print(dic)
输出:
defaultdict(<function zero at 0x000001754EB4B488>, {'bbb': 0})
`defaultdict` 和 `Counter` 都是 Python 的 `collections` 模块中非常有用的工具类。 ### defaultdict `defaultdict` 是字典的一个子类,它提供了一个默认值的功能。当你尝试访问一个不存在的键时,`defaultdict` 会自动创建该键,并赋予其一个默认值,而不是抛出 KeyError 异常。这使得处理数据更加方便快捷。 你可以通过传递给 `defaultdict` 构造函数一个工厂函数(例如 int、list 等),来指定当某个键未找到时应该返回什么样的默认值: ```python from collections import defaultdict # 创建一个int类型的defaultdict,默认值为0 d = defaultdict(int) print(d['a']) # 输出:0 ``` 在这个例子中,如果访问了不存在的键 `'a'` ,那么 `defaultdict` 就会给这个键赋上整型默认值 `0`. ### Counter `Counter` 同样也是 `collections` 下的一个类,它是专门用于计数的对象。可以将字符串列表等可迭代对象传入 `Counter`, 它将会统计每个元素出现次数并存储在一个类似于字典的数据结构里: ```python from collections import Counter c = Counter('abracadabra') print(c) # 输出: Counter({'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1}) ``` 这里我们看到,字母'a'出现了五次,'b','r'各两次... 此外还可以对两个 counter 进行加减运算得到新的 counter 对象等等操作. 两者结合使用案例: 有时候我们会想记录某些项的数量变化情况而不仅仅是一开始就有的内容,在这种情况下就可以利用 default dict 来动态增加 key 并用 counter 去计算数量. 比如我们要统计一段文本中单词数目: ```python from collections import defaultdict, Counter text = "one two three one four five six seven eight nine ten eleven twelve thirteen fourteen" words = text.split() word_counts = defaultdict(Counter) for word in words: if len(word) not in word_counts: word_counts[len(word)] = Counter() word_counts[len(word)][word] += 1 print(dict(word_counts)) ``` 上面的例子实现了按照字符长度分组后的词频统计表.
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值