pandas 中groupby()方法运用

最新推荐文章于 2024-03-03 15:53:13 发布

达达爱吃肉

最新推荐文章于 2024-03-03 15:53:13 发布

阅读量1.4k

点赞数 2

本文链接：https://blog.csdn.net/weixin_44706915/article/details/102777721

版权

理解groupby

groupby函数是如何工作的？

相信学习过sql的童鞋对groupby函数都不陌生，在sql中groupby的工作原理是先分组，再聚合。在Python的pandas中groupby的工作流程大体相似，就是分组-处理-合并，先举一个例子，假设我们要对Dataframe的某一字段每一相同的项进行求和：

import numpy as np
import pandas as pd
se1 = pd.DataFrame([['A',2],['B',4],['C',6],['B',8],['A',9],['C',7]],columns=['KEY','值'])

在这里插入图片描述
假设我们要对KEY字段进行分组求和：

result=se1.groupby(se1['KEY']).sum()

在这里插入图片描述
其工作原理如下图所示：

pandas中groupby方法具体使用

通过某一列分组

df1 = pd.DataFrame([['北京',10,'晴','10'],['上海',15,'晴','10'],['广州',20,'下雨','10'],['深圳',30,'阴天','10'],['北京',10,'晴','11'],['上海',15,'晴','11'],['广州',20,'下雨','11'],['深圳',30,'阴天','11']])
df1.columns=['city','temperature','sta','date']

在这里插入图片描述
通过city字段进行分组

df_gruopby = df1.groupby(df1['city'])

在这里插入图片描述
事实上此时的df_gruopdy没有任何数据，他只是一个可以操作的生成器，可以迭代出具体的索引和dataframe子组：
我们不妨遍历一下，看看其中有什么？

这就是已经分组好的数据，当然我们也可以对Dataframe某一列分组:（也可以理解为把分好租的dataframe子组只保留某一列或某几列）

df_gruopby = df1['date'].groupby(df1['city'])
for i,k in df_gruopby:
    print(i)
    print(k)

在这里插入图片描述
此时就完成了，通过“city”这一字段，对df对象的“date”列进行分组
当然我们也可以计算每个城市天气的平均值：

另外groupby还可以通过函数、通过series进行分组，这里就不再一一加以叙述。

达达爱吃肉

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫