关于DataFrame执行groupby的介绍

最新推荐文章于 2024-04-01 11:10:38 发布

qq_34734303

最新推荐文章于 2024-04-01 11:10:38 发布

阅读量656

点赞数

分类专栏： Python学习 DataFrame groupby 文章标签： Python学习 DataFrame groupby

本文链接：https://blog.csdn.net/qq_34734303/article/details/103067786

版权

14 篇文章 2 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

pandas提供了一个灵活高效的groupby功能，它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。这里我们主要关注DataFrame执行groupby聚合操作后，如何继续保持DataFrame对象，让其不变成Series对象。

如一下实例：
我们输出的一个DateFrame数据集 df，

  key  value
0   a      1
1   b      2
2   b      3
3   c      4
4   a      5
5   a      6
6   b      7
7   a      8
8   c      9

接下来我们要对key列重复的数据进行合并，一般语句为：

df1 = df.groupby(('key')).sum()

则有结果如下第一部分，此时不再是DataFrame对象，而变成Series对象，如下第二部分：

df1 = df.groupby(('key')).sum()

     value
key       
a       20
b       12
c       13

df['value']

[('value', key
a    20
b    12
c    13
Name: value, dtype: int64)]

如何继续保持DataFrame对象，让其不变成Series对象: 添加as_index=False,指定分组的列不作为index即可。

 df.groupby(('key'),as_index=False).sum()

  key  value
0   a     20
1   b     12
2   c     13

关注