python中pandas计数_python pandas透视表在一列中的计数频率

最新推荐文章于 2024-05-08 10:08:59 发布

weixin_39699070

最新推荐文章于 2024-05-08 10:08:59 发布

阅读量1.2k

点赞数

文章标签： python中pandas计数

这篇博客介绍了在Python的Pandas库中，如何使用pivot_table函数来计数数据框中特定列的出现频率。通过设置aggfunc参数为'size'，可以正确地统计Account_number和Product列的组合出现次数，而不会像使用'len'或'count'那样导致错误。示例代码和输出展示了正确使用该方法的实例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

解决方案：使用aggfunc='size'

使用aggfunc=len或aggfunc='count'与此页上的所有其他答案一样，对于包含三列以上的数据帧不起作用。默认情况下，pandas会将此aggfunc应用于index或columns参数中未找到的所有列。

例如，如果在原始数据框中定义了两个以上的列，则如下所示：df = pd.DataFrame({'Account_number':[1, 1, 2 ,2 ,2 ,3 ,3],

'Product':['A', 'A', 'A', 'B', 'B','A', 'B'],

'Price': [10] * 7,

'Quantity': [100] * 7})

输出：Account_number Product Price Quantity

0 1 A 10 100

1 1 A 10 100

2 2 A 10 100

3 2 B 10 100

4 2 B 10 100

5 3 A 10 100

6 3 B 10 100

如果将当前解决方案应用于此数据帧，将得到以下结果：df.pivot_table(index='Account_number',

columns='Product',

aggfunc=len,

fill_value=0)

输出：Price Quantity

Product A B A B

Account_number

1 2 0 2 0

2 1 2 1 2

3 1 1 1 1

溶液

相反，使用aggfunc='size'。由于size总是为每一列返回相同的数字，因此pandas不会对每一列调用它，而是只调用一次。df.pivot_table(index='Account_number',

columns='Product',

aggfunc='size',

fill_value=0)

输出：Product A B

Account_number

1 2 0

2 1 2

3 1 1

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。