Pandas中的数据聚合

本文介绍了如何使用Pandas的groupby方法进行数据聚合,包括count、sum、mean等操作,并展示了如何将聚合后的结果转换为DataFrame,更新列名,以及通过inner或outer join与原始DataFrame结合的方法。
摘要由CSDN通过智能技术生成

通过pandas的groupby方法,我们可以获得按组聚类后的各种方法等(count/sum/mean/median/std/var/min/max)

常用的方法为:

sku_tot_vol = data['unuseble_volume'].groupby([data.sku,data.location_code,data.unuseble_volume]).sum()

或者

df.groupby(['warehouse_code', 'storehouse_code','zone_use','packaging_attr','location_code','sku'])['total_quantity'].sum()

 需要筛选的字段可前可后

这时候形成的数据形式是:Series。

然鹅,很多时候我们需要把聚合后的结果与原有的DataFrame数据结合,那如何操作呢?

1.将sku_tot_vol转化为DataFrame格式的数据

Sku_tot_vol = pd.DataFrame(sku_tot_vol)

2.更新列名,因为形成的DataFrame数据没有列名

Sku_tot_vol.reset_index(inplace= True)

Sku_tot_vol = Sku_tot_vol.renam
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值