pd.pivot_table数据透视表与pd.crosstab交叉表

在数据分析中,常常需要用到数据透视表和交叉表,下面介绍pandas.DataFrame.pivot_table数据透视表和pandas.DataFrame.crosstab交叉表的用法和区别。

一、数据透视表

数据透视表用来做数据透视,可以通过一个或多个键分组聚合DataFrame中的数据,通过aggfunc参数决定聚合类型,是groupby的高级功能。

pd.pivot_table参数如下:

pd.pivot_table(data, values = None,index = None,columns = None,aggfunc ='mean',fill_value = None,margin = False,dropna = True,margins_name ='All' )
  • data:DataFrame对象
  • values:要聚合的列或列的列表
  • index:数据透视表的index,从原数据的列中筛选
  • columns:数据透视表的columns,从原数据的列中筛选
  • aggfunc:用于聚合的函数,默认为numpy.mean,支持numpy计算方法
  • fill_value: 用于替换缺失值的值
  • margin: 添加所有行/列
  • dropna: 不包括条目为 NaN的列,默认为True
  • margin_name: 当margin为True时,将包含总计的行/列的名称
date = ['2001-1-1','2001-1-2','2001-1-3']*3
rng = pd.to_datetime(date)
df = pd.DataFrame({'date':rng,
                   'key':list('abcdabcda'),
                  'values':np.random.rand(9)*10})
print(df)

1.以data做数据透视,统计不同key下value的和: 

pd.pivot_table(df, values = 'values', index = 'date', columns = 'key', aggfunc=np.sum)

2,这里就分别以date、key共同做数据透视,值为values:统计不同(date,key)情况下values的数量

pd.pivot_table(df, values = 'values', index = ['date','key'], aggfunc=len)

 

 

二、交叉表

默认情况下,crosstab是用来计算因子的频率表。

pd.crosstab()参数:

pd.crosstab(index, columns, values=None, rownames=None, colnames=None, aggfunc=None, margins=False, dropna=True, normalize=False)
  • index::要在行中分组的值
  • columns:要在列中分组的值
  • values:根据因子聚合的值数组,需指定aggfunc
  • aggfunc:如指定,还需指定value
  • normalize:将所有值除以值的总和进行归一化 ,为True时候显示百分比

1.如果crosstab只接收两个Series,它将提供一个频率表。用A的唯一值,统计B唯一值的出现次数:

df = pd.DataFrame({'A': [1, 2, 2, 2, 2],
                   'B': [3, 3, 4, 4, 4],
                   'C': [1, 1, np.nan, 1, 1]})

print(df)
print('-----')
print(pd.crosstab(df['A'],df['B']))

2.以A和B界定分组,计算出每组中第三个系列C的和

pd.crosstab(df['A'],df['B'],values=df['C'],aggfunc=np.sum)

三、区别

透视表是一种进行分组统计的函数,而交叉表是特殊的透视表,当只统计分组频率时更方便。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
©️2022 CSDN 皮肤主题:大白 设计师:CSDN官方博客 返回首页
评论 3

打赏作者

joychun

你的鼓励将是我创作的最大动力

¥2 ¥4 ¥6 ¥10 ¥20
输入1-500的整数
余额支付 (余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值