Pandas实现(pivot_table函数)数据透视表

使用pandas中的pivot_table()实现数据透视表。语法格式如下:

pd.pivot_table(data,values=None,index=None,
			   columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True,
			   margins_name='All')

pd.pivot_table()有四个最重要的参数index、values、columns、aggfunc。
四个最重要参数解析:
index:相当于SQL里的group by用于分组的字段,相当于行索引。index也是层次字段,要通过透视表获取什么信息就按照相应的顺序设置字段。

pd.pivot_table(data,index=['列名1','列名2'])

values:相当于SQL里对列进行聚合计算,对需要的计算数据进行筛选。

pd.pivot_table(data,index=['列名1','列名2'],values=['计算列名1','计算列名2','计算列名3'])

columns:columns类似index可以设置列层次字段,它不是一个必要参数,作为一种分割数据的可选方式。

pd.pivot_table(data,index=['列名1','列名2'],
				values=['计算列名1','计算列名2','计算列名3'],columns=['列名3'])

aggfunc:aggfunc参数可以设置对数据聚合时进行的函数操作。对于aggfunc参数,操作的是values后面的值,而不是columns后面的值。分别对values参数中的每一列都进行求和与求平均值。

pd.pivot_table(data,index=['列名1','列名2'],
				values=['计算列名1','计算列名2','计算列名3'],aggfunc=[np.sum,np.mean])

fill_value:当数据为空时,填充的指定值。fill_value=0
注意:aggfunc也可以使用dict类型,这样可以指定values中每一列的聚合函数。如果dict中的内容与values不匹配时,以dict中为准。

table=pd.pivot_table(data,index=['列名1','列名2'],columns=['列名3'],
					values=['计算列名1','计算列名2','计算列名3'],
					aggfunc={'计算列名1':np.mean,'计算列名2':[min, max, np.mean]},fill_value=0)

结果就是’计算列名2’求min,max和mean,'计算列名1’求mean,而’计算列名3’没有显示。

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值