1 定义
itertools.groupby(iterable, key=None)
说明
- 返回一个生成器,这个生成器从第1个参数(可迭代对象)中返回排序后的关键字和组;
- key是一个函数,计算每个元素的key值;
- 如果key不存在或为None,则返回的元素没有变化;
- 一般情况下,参与运算的可迭代对象,需要已经在分组关键字上,进行过排序。
返回的组本身就是一个迭代器,它与groupby()共享底层可迭代项。因为源是共享的,所以当groupby()对象向后迭代时,上一个组将不再可见。因此,如果以后需要该数据,则应将其存储为列表,示例:
groups = []
uniquekeys = []
data = sorted(data, key=keyfunc)
for k, g in groupby(data, keyfunc):
groups.append(list(g)) # Store group iterator as a list
uniquekeys.append(k)
带数据的示例:
from itertools import groupby
from operator import itemgetter
data = [('aaa', 11), ('aaa', 3), ('bbb', 10),
('bbb', 4), ('bbb', 22), ('ccc', 33)]
groups = []
uniquekeys = []
data = sorted(data, key=itemgetter(0))
for k, g in groupby(data, key=itemgetter(0)):
groups.append(list(g)) # Store group iterator as a list
uniquekeys.append(k)
返回:
['aaa', 'bbb', 'ccc']
[[('aaa', 11), ('aaa', 3)], [('bbb', 10), ('bbb', 4), ('bbb', 22)], [('ccc', 33)]]