Pandas分组计算

分组函数 groupby

        效果就SQL里面的groupby,使用方法大致一样

        df.groupby(["列名1","列名1"],as_index=True).sum()

                先按照列名1进行分组,再按照列名2进行分组;

                as_index默认值是True,效果是拿分组的数据作为行索引,如果为Fasle则用0,1作为行索引

分组并按照指定列进行计算

        df.groupby(["列名1","列名1"]["指定计算的列名"]).sum()

        加上指定的列名就能只对该列名进行计算

分组的迭代查看

        多个列名为一组

        for (k1,k2),group in df.groupby(["列名1","列名1"]):

                print(k1,k2)

                print(group)

        (k1,k2)是分组后的组名,group是分组后的数据

分组后的聚合运算

        df.groupby(["列名1","列名1"],as_index=True).agg(['sum','mean'])

        此条语句能够在指定分组后使用sum函数求得总和值,使用mean函数求得均值

  

分组后的对不同列执行不同聚合函数操作

        df.groupby(["列名1","列名1"],as_index=True).agg({”列名1“:['sum','mean'],"列名2":'['Max']})

         此条语句能够在指定分组后对列名1的数据求总和值和均值,对列名2求最大值

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值