正如Sebastjan所说,你首先必须排序你的数据。这个很重要。
我没有得到的部分是在示例中的结构
groups = []
uniquekeys = []
for k, g in groupby(data, keyfunc):
groups.append(list(g)) # Store group iterator as a list
uniquekeys.append(k)
k是当前分组键,g是迭代器,您可以使用它迭代由该分组键定义的组。换句话说,groupby迭代器本身返回迭代器。
这里有一个例子,使用更清晰的变量名:
from itertools import groupby
things = [("animal", "bear"), ("animal", "duck"), ("plant", "cactus"), ("vehicle", "speed boat"), ("vehicle", "school bus")]
for key, group in groupby(things, lambda x: x[0]):
for thing in group:
print "A %s is a %s." % (thing[1], key)
print " "
这将给你输出:
A bear is a animal.
A duck is a animal.
A cactus is a plant.
A speed boat is a vehicle.
A school bus is a vehicle.
在此示例中,事物是元组的列表,其中每个元组中的第一项是第二项所属的组。
groupby()函数有两个参数:(1)数据分组和(2)函数分组。
这里,lambda x:x [0]告诉groupby()使用每个元组中的第一个项作为分组键。
在上面的for语句中,groupby返回三个(键,组迭代器)对 – 每个唯一键一次。您可以使用返回的迭代器迭代该组中的每个单个项目。
下面是使用列表解析的相同数据的一个稍微不同的示例:
for key, group in groupby(things, lambda x: x[0]):
listOfThings = " and ".join([thing[1] for thing in group])
print key + "s: " + listOfThings + "."
这将给你输出:
animals: bear and duck. plants: cactus. vehicles: speed boat and school bus.