【Python系列专栏】第六十三篇 Python中 Pandas 数据透视表

最新推荐文章于 2024-01-13 10:05:10 发布

Mrrunsen

最新推荐文章于 2024-01-13 10:05:10 发布

阅读量214

点赞数

分类专栏： Python 文章标签： python 数据分析大数据机器学习 java

本文链接：https://blog.csdn.net/Mrrunsen/article/details/116466403

版权

Python 专栏收录该内容

77 篇文章 9 订阅

订阅专栏

数据透视表

在Excel中有一个非常强大的功能就是数据透视表，通过托拉拽的方式可以迅速的查看数据的聚合情况，这里的聚合可以是计数、求和、均值、标准差等。

pandas为我们提供了非常强大的函数pivot_table()，该函数就是实现数据透视表功能的。对于上面所说的一些聚合函数，可以通过参数aggfunc设定。我们先看看这个函数的语法和参数吧：

pivot_table(data,values=None,
                   index=None,
                   columns=None,
                   aggfunc='mean',
                   fill_value=None,
                   margins=False,
                   dropna=True,
                   margins_name='All')

data：需要进行数据透视表操作的数据框
values：指定需要聚合的字段
index: 指定某些原始变量作为行索引
columns: 指定哪些离散的分组变量
aggfunc: 指定相应的聚合函数，默认为numpy.mean()
fill_value：使用一个常数替代缺失值，默认不替换
margins: 是否进行行或列的汇总，默认不汇总
dropna: 默认所有观测为缺失的列
margins_name：默认行汇总或列汇总的名称为’All’