【Python系列专栏】第六十三篇 Python中 Pandas 数据透视表

.

数据透视表

在Excel中有一个非常强大的功能就是数据透视表,通过托拉拽的方式可以迅速的查看数据的聚合情况,这里的聚合可以是计数、求和、均值、标准差等。

pandas为我们提供了非常强大的函数pivot_table(),该函数就是实现数据透视表功能的。对于上面所说的一些聚合函数,可以通过参数aggfunc设定。我们先看看这个函数的语法和参数吧:

pivot_table(data,values=None,
                   index=None,
                   columns=None,
                   aggfunc='mean',
                   fill_value=None,
                   margins=False,
                   dropna=True,
                   margins_name='All')
  • data:需要进行数据透视表操作的数据框
  • values:指定需要聚合的字段
  • index: 指定某些原始变量作为行索引
  • columns: 指定哪些离散的分组变量
  • aggfunc: 指定相应的聚合函数,默认为numpy.mean()
  • fill_value:使用一个常数替代缺失值,默认不替换
  • margins: 是否进行行或列的汇总,默认不汇总
  • dropna: 默认所有观测为缺失的列
  • margins_name:默认行汇总或列汇总的名称为’All’

我们仍然以student表为例,来认识一下数据透视表pivot_table函数的用法:

对一个分组变量(Sex),一个数值变量(Height)作统计汇总:

g25

对一个分组变量(Sex),两个数值变量(Height,Weight)作统计汇总:

g26

对两个分组变量(Sex,Age),两个数值变量(Height,Weight)作统计汇总:

g27

很显然这样的结果并不像Excel中预期的那样,该如何变成列联表的形式的?很简单,只需**将结果进行非堆叠操作(unstack)**即可:

g29

看,这样的结果是不是比上面那种看起来更舒服一点?

使用多个聚合函数

g30

有关更多数据透视表的操作,可参考《Pandas透视表(pivot_table)详解》一文。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mrrunsen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值