《Python for Data Analysis》
GroupBy
分组运算:split-apply-combine(拆分-应用-合并)
DataFrame可以在其行(axis=0)或列(axis=1)上进行分组。然后,将一个函数应用到各个分组并产生新值。最后,所有这些函数的执行结果会被合并到最终的结果对象中去。
GroupBy的size方法可以返回一个含有分组大小的Series。
- 对分组进行迭代
for (k1,k2), group in df.groupby(['key1','key2']):
print k1,k2
print group
- 选取一个或一组列
df.groupby(['key1','key2'])[['data2']].mean()
- 通过字典或