python中pandas计数_python pandas透视表在一列中的计数频率

这篇博客介绍了在Python的Pandas库中,如何使用pivot_table函数来计数数据框中特定列的出现频率。通过设置aggfunc参数为'size',可以正确地统计Account_number和Product列的组合出现次数,而不会像使用'len'或'count'那样导致错误。示例代码和输出展示了正确使用该方法的实例。
摘要由CSDN通过智能技术生成

解决方案:使用aggfunc='size'

使用aggfunc=len或aggfunc='count'与此页上的所有其他答案一样,对于包含三列以上的数据帧不起作用。默认情况下,pandas会将此aggfunc应用于index或columns参数中未找到的所有列。

例如,如果在原始数据框中定义了两个以上的列,则如下所示:df = pd.DataFrame({'Account_number':[1, 1, 2 ,2 ,2 ,3 ,3],

'Product':['A', 'A', 'A', 'B', 'B','A', 'B'],

'Price': [10] * 7,

'Quantity': [100] * 7})

输出:Account_number Product Price Quantity

0 1 A 10 100

1 1 A 10 100

2 2 A 10 100

3 2 B 10 100

4 2 B 10 100

5 3 A 10 100

6 3 B 10 100

如果将当前解决方案应用于此数据帧,将得到以下结果:df.pivot_table(index='Account_number',

columns='Product',

aggfunc=len,

fill_value=0)

输出:Price Quantity

Prod

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Pandas 是一个强大的数据分析工具,提供了很多常用的函数来处理数据,下面是一些常用的函数及其用法: 1. read_csv():读取 CSV 文件并返回一个 DataFrame 对象。 2. head():返回 DataFrame 的前几行数据,默认为前 5 行。 3. tail():返回 DataFrame 的后几行数据,默认为后 5 行。 4. info():返回 DataFrame 的基本信息,包括每列的数据类型、非空值数量等。 5. describe():返回 DataFrame 的基本统计信息,包括计数、均值、标准差、最小值、最大值等。 6. shape:返回 DataFrame 的行数和列数。 7. columns:返回 DataFrame 的列名。 8. index:返回 DataFrame 的行索引。 9. loc[]:根据行标签和列标签访问 DataFrame 的元素。 10. iloc[]:根据行索引和列索引访问 DataFrame 的元素。 11. dropna():删除 DataFrame 的缺失值。 12. fillna():用指定的值或方法填充 DataFrame 的缺失值。 13. groupby():按照指定的列对 DataFrame 进行分组。 14. apply():对 DataFrame 的每一列应用指定的函数。 15. pivot_table():根据指定的列计算 DataFrame 的透视表。 16. merge():将两个 DataFrame 按照指定的列进行合并。 17. sort_values():按照指定的列对 DataFrame 进行排序。 18. drop_duplicates():去除 DataFrame 的重复行。 19. value_counts():统计 DataFrame 每个元素出现的次数。 20. isnull():判断 DataFrame 的元素是否为空值。 这些函数覆盖了 Pandas 的很多常用操作,掌握它们对于数据分析和处理非常有帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值