在Pandas中,数据透视表是一个非常有用的工具,可以根据一个或更多的值字段将数据聚合为二维表格。要在数据透视表中添加计算字段和计算项,Pandas提供了灵活 convenient 的方式。
创建数据透视表
使用`.pivot_table()`方法可以轻松创建数据透视表。例如,有这样一个DataFrame:
| product | region | sales |
:--|:--|:--|:--
0 | apple | east | 100
1 | apple | west | 80
2 | banana | east | 70
3 | banana | west | 110
可以这样创建一个数据透视表:
pivot = df.pivot_table(
values='sales',
index='product',
columns='region',
aggfunc=sum,
margins=True
)
得到的结果为:
product east west All
apple 100.0 80.0 180.0
banana 70.0 110.0 180.0
All 170.0 190.0 360.0
计算项和聚合函数
在`values`参数中指定需要聚合的字段,这将成为**计算项**。然后在`aggfunc`参数中指定聚合函数,如`sum`、`mean`、`count`等,用于计算各计算项的值。
如上例中,我们将`sales`字段指定为计算项,使用`sum`函数计算总销售额,从而得出`east`、`west`和`All`三个计算项的值。
计算字段
在`columns`或`index`参数中指定需要在透视表中添加为行列索引的值字段,这可以成为**计算字段**。
如上例中,我们将`region`字段指定为列计算字段,将`product`字段指定为行计算字段。并使用`margins=True`添加`All`计算字段。
总结
所以,通过灵活地指定`values`、`aggfunc`、`columns`和`index`参数,我们可以在Pandas数据透视表中添加自定义的计算字段和计算项,实现数据的聚合与分析。