我试图用numpygenfromtxt将csv文件读入一个结构化数组。我计划对它进行排序,然后使用groupby根据其中一列的字符串值将文件分成组。最后,我将拼接每个组中的列以进行附加处理。在
下面是一个小例子,我想为每个组返回一个特定的列。在import numpy as np
from itertools import groupby
food1 = [[" vegetable", "tomato"], [" vegetable", "spinach"], [" fruit", "watermelon"], [" fruit", "grapes"], [" meat", "beef"]]
for key, group in groupby(food1, lambda x: x[0]):
print key
group[:1]
# In the line above, TypeError: 'itertools._grouper' object is unsubscriptable, I have tried it with food1 or food2
for thing in group:
print key + ": " + thing[1];
print " "
我想要的输出是返回按第一列值分组的第二列的几个数组
所以
蔬菜:[“番茄”,“菠菜”],
水果:[“西瓜”,“葡萄”]。。。等等
我试图拼接groupby中的group return,但是由于它是迭代器,我会得到TypeError:'itertools.\u grouper'对象是不可订阅的。在
我知道我可以拼接从genfromtxt加载的数据,但正是先分组后拼接的组合给我带来了麻烦。在
^{pr2}$
还有什么其他的想法我怎么才能完成这个小组然后拼接?在
谢谢。在