pandas -- 基础操作(六):数据分组及透视表,df.groupby、pd.pivot,、pd.pivot_table、stack(堆叠)、 unstack(不堆叠)

本文详细介绍了Pandas中的数据分组和透视表操作,包括df.groupby的基本用法,如数据分组格式、基础实例和设置分组列为index的操作。此外,还探讨了透视表的创建,如pd.pivot、pd.pivot_table的使用,以及如何处理数据中的重复条目。最后,文章提及了stack和unstack在行列转换中的应用。
摘要由CSDN通过智能技术生成


前言

数据分组和数据透视表是常用的数据汇总工具,它可以根据一个或多个制定的维度对数据进行聚合和重组。


一、数据分组

什么是数据分组:
数据分组就是根据一个或多个键(可以是函数、数组或dataframe列名)将数据分为若干组,然后对分组后的数据分别进行汇总计算,并将汇总计算后的结果进行合并,被用作汇总计算的函数被称为聚合函数。
—https://www.jianshu.com/p/2be7ae8dc022

1.1 数据分组格式
DataFrame.groupby(self, by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False, **kwargs)
by :需要分组的列数据,可以为单个的列,若为多列直接为list列表
axis : 维度
1.2 基础实例
df  # 实例数据
Out[86]: 
  key  data1  data2
0   A      0      5
1   B      1      0
2   C      2      3
3   A      3      3
4   B      4      7
5   C      5      9
df.groupby(by='key')
Out[87]: <pandas.core.groupby.generic.DataFrameGroupBy object at 0x000001A7E1939E08>
df.groupby(by='key').size()  # 分组后数据的数量
Out[88]: 
key
A    2
B    2
C    2
dtype: int64
# 除了sum() ,其他计算方式同样适用
df.groupby(by='key').sum
  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值