pandas -- 基础操作(六):数据分组及透视表，df.groupby、pd.pivot,、pd.pivot_table、stack(堆叠)、 unstack（不堆叠）

最新推荐文章于 2024-06-14 16:41:27 发布

高高兴兴5788

最新推荐文章于 2024-06-14 16:41:27 发布

阅读量2k

点赞数 1

分类专栏： python基础学习文章标签： python 数据分析

本文链接：https://blog.csdn.net/qq_33624802/article/details/110823520

版权

本文详细介绍了Pandas中的数据分组和透视表操作，包括df.groupby的基本用法，如数据分组格式、基础实例和设置分组列为index的操作。此外，还探讨了透视表的创建，如pd.pivot、pd.pivot_table的使用，以及如何处理数据中的重复条目。最后，文章提及了stack和unstack在行列转换中的应用。

摘要由CSDN通过智能技术生成

前言

数据分组和数据透视表是常用的数据汇总工具，它可以根据一个或多个制定的维度对数据进行聚合和重组。

一、数据分组

什么是数据分组：
数据分组就是根据一个或多个键（可以是函数、数组或dataframe列名）将数据分为若干组，然后对分组后的数据分别进行汇总计算，并将汇总计算后的结果进行合并，被用作汇总计算的函数被称为聚合函数。
—https://www.jianshu.com/p/2be7ae8dc022

1.1 数据分组格式

DataFrame.groupby(self, by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False, **kwargs)

by ：需要分组的列数据，可以为单个的列，若为多列直接为list列表
axis : 维度

1.2 基础实例

df  # 实例数据
Out[86]: 
  key  data1  data2
0   A      0      5
1   B      1      0
2   C      2      3
3   A      3      3
4   B      4      7
5   C      5      9
df.groupby(by='key')
Out[87]: <pandas.core.groupby.generic.DataFrameGroupBy object at 0x000001A7E1939E08>
df.groupby(by='key').size()  # 分组后数据的数量
Out[88]: 
key
A    2
B    2
C    2
dtype: int64
# 除了sum() ，其他计算方式同样适用
df.groupby(by='key').sum

最低0.47元/天解锁文章

高高兴兴5788

关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
pandas -- 基础操作(六):数据分组及透视表，df.groupby、pd.pivot,、pd.pivot_table、stack(堆叠)、 unstack（不堆叠）

文章目录前言一、数据分组1.1 数据分组格式1.2 基础实例1.3 将分组列设置为index，对index进行整体操作1.4二、透视表1.pd.pivot2.pd.pivot_table3. df.stack\df.unstack总结前言数据分组和数据透视表是常用的数据汇总工具，它可以根据一个或多个制定的维度对数据进行聚合和重组。一、数据分组什么是数据分组：数据分组就是根据一个或多个键（可以是函数、数组或dataframe列名）将数据分为若干组，然后对分组后的数据分别进行汇总计算..
复制链接

扫一扫

专栏目录