关于DataFrame执行groupby的介绍
pandas提供了一个灵活高效的groupby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。这里我们主要关注DataFrame执行groupby聚合操作后,如何继续保持DataFrame对象,让其不变成Series对象。
如一下实例:
我们输出的一个DateFrame数据集 df,
key value
0 a 1
1 b 2
2 b 3
3 c 4
4 a 5
5 a 6
6 b 7
7 a 8
8 c 9
接下来我们要对key列重复的数据进行合并,一般语句为:
df1 = df.groupby(('key')).sum()
则有结果如下第一部分,此时不再是DataFrame对象,而变成Series对象,如下第二部分:
df1 = df.groupby(('key')).sum()
value
key
a 20
b 12
c 13
df['value']
[('value', key
a 20
b 12
c 13
Name: value, dtype: int64)]
如何继续保持DataFrame对象,让其不变成Series对象: 添加as_index=False,指定分组的列不作为index即可。
df.groupby(('key'),as_index=False).sum()
key value
0 a 20
1 b 12
2 c 13