使用Counter()计数
说起计数器,标准库有一个计数器,它可以胜任之前或者更多示例所做的工作:
>>> from collections import Counter
>>> breakfast = ['spam', 'spam', 'eggs', 'spam']
>>> breakfast_counter = Counter(breakfast)
>>> breakfast_counter
Counter({'spam': 3, 'eggs': 1})
函数most_common() 以降序返回所有元素,或者如果给定一个数字,会返回该数字前的的
元素:
>>> breakfast_counter.most_common()
[('spam', 3), ('eggs', 1)]
>>> breakfast_counter.most_common(1)
[('spam', 3)]
也可以组合计数器。首先来看一下breakfast_counter:
>>> breakfast_counter
>>> Counter({'spam': 3, 'eggs': 1})
这一次,新建一个列表lunch 和一个计数器lunch_counter:
>>> lunch = ['eggs', 'eggs', 'bacon']
>>> lunch_counter = Counter(lunch)
>>> lunch_counter
Counter({'eggs': 2, 'bacon': 1})
第一种组合计数器的方式是使用+:
>>> breakfast_counter + lunch_counter
Counter({'spam': 3, 'eggs': 3, 'bacon': 1})
你也可能想到,从一个计数器去掉另一个,可以使用-。什么是早餐有的而午餐没有的呢?
>>> breakfast_counter - lunch_counter
Counter({'spam': 3})
那么什么又是午餐有的而早餐没有的呢?
>>> lunch_counter - breakfast_counter
Counter({'bacon': 1, 'eggs': 1})
和第4 章中的集合类似,可以使用交集运算符& 得到二者共有的项:
>>> breakfast_counter & lunch_counter
Counter({'eggs': 1})
两者的交集通过取两者中的较小计数,得到共同元素'eggs'。这合情合理:早餐仅提供一
个鸡蛋,因此也是共有的计数。
最后,使用并集运算符| 得到所有元素:
>>> breakfast_counter | lunch_counter
Counter({'spam': 3, 'eggs': 2, 'bacon': 1})
'eggs' 又是两者共有的项。不同于合并,并集没有把计数加起来,而是取其中较大的值。