pandas数据处理三:数据聚合&高级数据聚合
数据聚合
- 数据聚合是数据处理的最后一步,通常是要使每一个数组生成一个单一的数值。
- 数据分类处理:
- 分组:先把数据分为几组
- 聚合 , 求分组组内的数据聚合
- 合并:把不同组得到的结果合并起来
- 数据分类处理的核心: groupby()函数
例子:统计出color的总price, 再合并到原表种
df = DataFrame({'color':['red','white','red','cyan','cyan','green','white','cyan'],
'price':np.random.randint(0,8,size = 8),
'weight':np.random.randint(50,55,size = 8)})
df

分组
# 分组
df.groupby(by='color')

使用.groups属性查看各行的分组情况:

数据聚合是数据分析的关键步骤,包括分组、聚合和合并。通过groupby()函数进行分组,利用聚合函数计算每组的统计量。在高级数据聚合中,可以使用pd.merge()结合add_prefix()进行结果合并,并通过transform或apply实现更复杂的操作。apply()函数尤其强大,能处理包括字符串在内的各种数据类型。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



