pandas数据处理三:数据聚合&高级数据聚合
数据聚合
- 数据聚合是数据处理的最后一步,通常是要使每一个数组生成一个单一的数值。
- 数据分类处理:
- 分组:先把数据分为几组
- 聚合 , 求分组组内的数据聚合
- 合并:把不同组得到的结果合并起来
- 数据分类处理的核心: groupby()函数
例子:统计出color的总price, 再合并到原表种
df = DataFrame({'color':['red','white','red','cyan','cyan','green','white','cyan'],
'price':np.random.randint(0,8,size = 8),
'weight':np.random.randint(50,55,size = 8)})
df
分组
# 分组
df.groupby(by='color')