『Python』Pandas数据透视表(pivot_table)的存储与读取

最新推荐文章于 2024-09-23 20:29:49 发布

Python捞数人

最新推荐文章于 2024-09-23 20:29:49 发布

阅读量632

点赞数 3

分类专栏： Python 文章标签： python pandas 开发语言

本文链接：https://blog.csdn.net/m0_47149835/article/details/139301205

版权

Python 专栏收录该内容

21 篇文章

订阅专栏

当对某个 $D a t a F r am e$ 进行 pd.pivot_table 操作时，输出的透视表的列名会根据参数 $co l u mn s$ 所指定的列内含有的类别进行细分，最终生成到 $E x ce l$ 时，列名也会占据多行，虽然提高了肉眼的可读性，但再次用程序加载得到的表并不方便处理

Last updated: $\space$ 2024/05/31

创建一个DateFrame

df = pd.DataFrame(
	              data={'User': ['Jaye', 'Ben', 'Ben', 'Jaye', 'Leo'], 
                        'Class one?': ['Y', 'N', 'Y', 'Y', 'N'], 
                        'Value': [5, 7.0, 10, 2, 8.8], })
                        
>> User Class one?  Value
0  Jaye          Y    5.0
1   Ben          N    7.0
2   Ben          Y   10.0
3  Jaye          Y    2.0
4   Leo          N    8.8

创建数据透视表

df_pivot = pd.pivot_table(df, index='User', columns='Class one?', aggfunc='sum')
df_pivot.to_excel('testing.xlsx')

在这里插入图片描述

仔细观察 $M u lt i I n d e x$

$pivot\_table$ 的 $co l u mn s$ 是 $M u lt i I n d e x$

遍历输出后发现它由多个 $t u pl e$ 组成，每一个 $t u pl e$ 都代表了最细粒度的类别
在这里插入图片描述

输出到 $E x ce l$ 并重新读取

在这里插入图片描述

通过参数index_col(对应 $in d e x$ ) 和 header(对于 $co l u mn s$ ), 就可以读取前文已经输出到 $E x ce l$ 的数据透视表

pd.read_excel('testing.xlsx', index_col=0, header=[0, 1])

index_col=0表示将第一列设为 $in d e x$
header=[0, 1]表示将第1~2行作为 $co l u mn s$

在这里插入图片描述

『Python』Pandas数据透视表(pivot_table)的存储与读取

创建一个DateFrame

创建数据透视表

仔细观察 M u l t i I n d e x MultiIndex MultiIndex

输出到 E x c e l Excel Excel并重新读取

仔细观察 $M u lt i I n d e x$

输出到 $E x ce l$ 并重新读取