数据分析之Pandas(十)高级处理-分组与聚合

本文介绍Pandas中的高级处理方法——分组与聚合,通过案例分析星巴克零售店铺数据,展示如何按特定列分组并进行统计操作,如计算平均值和数量,同时探讨了与MultiIndex结构的关联。
摘要由CSDN通过智能技术生成

高级处理-分组与聚合

分组与聚合通常是分析数据的一种方式,通常与一些统计函数一起使用,查看数据的分组情况

想一想其实刚才的交叉表与透视表也有分组的功能,所以算是分组的一种形式,只不过他们主要是计算次数或者计算比例!!看其中的效果:
在这里插入图片描述

什么是分组与聚合

数据分析中,常常需要把数据量相对较大的数据分成若干各组,然后分别对小的组中的数据做统计分析操作,比如说分析员工工资状况与员工的性别/入职年份/部分之间的关系时。

分组与聚合的内部过程:分组 -> 统计得出每一个小的组的统计值 -> 合并成最终结果
在这里插入图片描述

分组与聚合API
  • DataFrame.groupby(),生成 DataFrameGroupBy
  • Series.groupby(),生成 SeriesGroupBy

通过DataFrame来做groupby相对方便一些,因为只需要传分组依据所在的列的名称即可

  • DataFrame.groupby(key, as_index=False)
    • key:分组的列数据,可以多个
  • 案例:不同颜色的不同笔的价格数据
data =pd.DataFrame({
   'color': ['white'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值