逆向透视表 python_在Python中格式化透视表

最新推荐文章于 2023-02-09 09:26:01 发布

智商低的小北尧

最新推荐文章于 2023-02-09 09:26:01 发布

阅读量175

点赞数

文章标签：逆向透视表 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36350547/article/details/114049575

版权

本文介绍了如何使用Python的pandas库进行数据透视并按频率排序。作者展示了一段代码，该代码首先创建了一个DataFrame，然后通过pivot_table函数进行透视，接着对结果进行填充、求和与排序，最后输出了排序后的透视表。目前的问题是结果并未完全符合作者的需求，他们寻求帮助以获取每个X值下Y和Z的最高频率组合。

摘要由CSDN通过智能技术生成

我正在尝试根据不同列中的计数重新格式化表。在df = pd.DataFrame({'Number': [1, 2, 3, 4, 5], 'X' : ['X1', 'X2', 'X3', 'X3', 'X3'], 'Y' : ['Y2','Y1','Y1','Y1', 'Y2'], 'Z' : ['Z3','Z1','Z1','Z2','Z1']})

Number X Y Z

0 1 X1 Y2 Z3

1 2 X2 Y1 Z1

2 3 X3 Y1 Z1

3 4 X3 Y1 Z2

4 5 X3 Y2 Z1

我希望最上面的一行按频率X排序(首先是X3，因为它出现了两次)，然后对于每个X值，计算其Y和Z值的频率，然后打印显示最多的一个。在

^{pr2}$

到目前为止，我有可以排序的代码import pandas as pd

df = pd.DataFrame({'Number': [1, 2, 3, 4, 5], 'X' : ['X1', 'X2', 'X3', 'X3', 'X3'], 'Y' : ['Y2','Y1','Y1','Y1', 'Y2'], 'Z' : ['Z3','Z1','Z1','Z2','Z1']})

pivot = df.pivot_table(index='X', columns=['Y', 'Z'], values = 'Number', aggfunc='count')

# clean the table from NaNs (not necessary, but more beautiful):

pivot.fillna(0, inplace=True)

pivot['sum'] = pivot.sum(axis=1)

pivot.sort('sum', ascending=False, inplace=True)

df = pivot[:5].transpose()

df.to_csv('sorted.csv')

和输出：Y Z X3 X1 X2

Y1 Z1 1 0 1

Y1 Z2 1 0 0

Y2 Z1 1 0 0

Y2 Z3 0 1 0

sum 3 1 1

但这仍然不是我要找的，有人能帮我吗？谢谢您！在

智商低的小北尧

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
逆向透视表 python_在Python中格式化透视表

我正在尝试根据不同列中的计数重新格式化表。在df = pd.DataFrame({'Number': [1, 2, 3, 4, 5], 'X' : ['X1', 'X2', 'X3', 'X3', 'X3'], 'Y' : ['Y2','Y1','Y1','Y1', 'Y2'], 'Z' : ['Z3','Z1','Z1','Z2','Z1']})Number X Y Z0 ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。