pandas分组计算平均值_数据处理进阶pandas入门（十五）

最新推荐文章于 2023-06-19 10:55:42 发布

榛禾木

最新推荐文章于 2023-06-19 10:55:42 发布

阅读量3.5k

点赞数

文章标签： pandas分组计算平均值

本文链接：https://blog.csdn.net/weixin_30767323/article/details/112440147

版权

回顾

在数据处理进阶pandas入门(十四)中，我们介绍了pandas中的去重与替换，需要掌握去重方法duplicates()方法和drop_duplicates()方法以及替换方法replace()的基本用法。今天我们讲一下pandas中分组的相关内容。

分组方法groupby()

在对数据进行处理的时候，我们常常会用到分组。pandas为我们提供了groupby()方法来进行分组。分组的具体过程如下：首先根据某些条件将数据拆分成组，然后对每个组独立应用函数方法进行相应的数据运算或处理，最后将结果合并到一个数据结构中。

pandas主要针对DataFrame进行分组操作。DataFrame可以在行(axis=0)或列(axis=1)上进行分组，将一个函数应用到各分组并生成一个新值，然后函数执行结果被合并到最终的结果对象中。下面我们看一下groupby()方法的基本用法。

import numpy as npimport pandas as pddf = pd.DataFrame({'A':['a', 'b', 'a', 'b', 'a', 'b', 'a', 'a'], 'B':['c', 'c', 'd', 'e', 'b', 'b', 'a', 'c'], 'C':np.random.randn(8), 'D':np.random.randn(8)})print(df)print("---------------")# groupby()返回结果是一个groupby对象，是一个中间数据，没有进行计算print(df.groupby('A'))print("---------------")print(df.groupby('A').mean())

运行结果如下图所示。注意，groupby()方法的返回结果只是一个groupby对象，是一个中间数据，只有进行计算后的结果才会生成一个新的DataFrame。上述代码中对列A进行分组，A中共有a、b两个值，所以会被分成两组，进行求平均值计算，而列B是字符数据，所以会自动过滤，只对列C和列D进行分组后的计算。

最低0.47元/天解锁文章

榛禾木

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pandas分组计算平均值_数据处理进阶pandas入门（十五）

回顾在数据处理进阶pandas入门(十四)中，我们介绍了pandas中的去重与替换，需要掌握去重方法duplicates()方法和drop_duplicates()方法以及替换方法replace()的基本用法。今天我们讲一下pandas中分组的相关内容。分组方法groupby() 在对数据进行处理的时候，我们常常会用到分组。pandas为我们提供了groupby()方法来进行分组。分组的具体过程...
复制链接

扫一扫