Pandas之七分组统计

Pandas之七分组统计

关注微信公众号:数据研发技术,点击菜单:PY宝典,查看往期精彩内容

在数据分析时,分组也是一个常用的功能,比如分别统计每个月的股票波动率、每个部门的人数、每个季度的利润等等。在Pandas中提供了groupy方法对数据进行分组。Pandas中的groupby一般包括以下三个步骤:

  1. 拆分,依据指定的规则将数据拆分为不同的组合。
  2. 执行函数,将一个方法相对独立地在每个组合上执行。
  3. 组合,将每个组合上执行的结果组合到一个结果集中。

下面我们以图中的数据来演示上述各项功能。

1、分组

使用groupby方法,将df3进行分组,并使用list查看分组的内容。

g1 = df3.groupby("E")
g1
list(g1)

可以看到,分组实际上是将指定分组的列不同值作为key(默认忽略np.nan,可以使用dropna=False配置修改),再将dataframe中相应的数据拆分出来作为其value

2、求和示例

分组后的对象,可以使用多种内置聚合函数,比如求和sum、平均值mean、标准差std等。本例对分组后的对象g1进行求和,计算根据E列分组后,其他各列求和的结果。

也可以计算指定列的求和结果,比如只计算A列的和。


点个关注再走呗👉👉👉

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值