怎么用pandas写数据透视表的计算字段和计算项?

最新推荐文章于 2024-05-08 10:08:59 发布

devid008

最新推荐文章于 2024-05-08 10:08:59 发布

阅读量399

点赞数

分类专栏： python 文章标签： pandas python 数据分析

本文链接：https://blog.csdn.net/devid008/article/details/131029894

版权

python 专栏收录该内容

87 篇文章 6 订阅

订阅专栏

在Pandas中，使用pivot_table()方法可以创建数据透视表，通过values参数指定计算项，如sales字段，并用aggfunc指定聚合函数，如sum。同时，通过columns和index设置计算字段，例如region和product，添加margins=True可得到总计。这样可以灵活分析数据。

摘要由CSDN通过智能技术生成

在Pandas中,数据透视表是一个非常有用的工具,可以根据一个或更多的值字段将数据聚合为二维表格。要在数据透视表中添加计算字段和计算项,Pandas提供了灵活 convenient 的方式。

创建数据透视表
使用`.pivot_table()`方法可以轻松创建数据透视表。例如,有这样一个DataFrame:

   | product | region | sales |  
:--|:--|:--|:--  
0 |   apple  |   east |   100
1 |   apple  |   west |    80  
2 |  banana |   east  |    70 
3 |  banana |   west |   110

可以这样创建一个数据透视表:

pivot = df.pivot_table(    
    values='sales',     
    index='product',    
    columns='region',    
    aggfunc=sum,     
    margins=True  
)

得到的结果为:

   product  east  west  All
apple    100.0   80.0  180.0  
banana    70.0  110.0  180.0  
All      170.0  190.0  360.0

计算项和聚合函数
在`values`参数中指定需要聚合的字段,这将成为**计算项**。然后在`aggfunc`参数中指定聚合函数,如`sum`、`mean`、`count`等,用于计算各计算项的值。
如上例中,我们将`sales`字段指定为计算项,使用`sum`函数计算总销售额,从而得出`east`、`west`和`All`三个计算项的值。

计算字段
在`columns`或`index`参数中指定需要在透视表中添加为行列索引的值字段,这可以成为**计算字段**。
如上例中,我们将`region`字段指定为列计算字段,将`product`字段指定为行计算字段。并使用`margins=True`添加`All`计算字段。

总结
所以,通过灵活地指定`values`、`aggfunc`、`columns`和`index`参数,我们可以在Pandas数据透视表中添加自定义的计算字段和计算项,实现数据的聚合与分析。