2.pandas应用 - 数据透视

最新推荐文章于 2024-06-14 16:41:27 发布

远行的人

最新推荐文章于 2024-06-14 16:41:27 发布

阅读量61

点赞数

分类专栏：学习记录 pandas 文章标签： pandas

本文链接：https://blog.csdn.net/weixin_38359644/article/details/133772849

版权

学习记录同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

pandas

12 篇文章 0 订阅

订阅专栏

pivot_table() 主要字段

index = 行索引
columns = 列索引
values = 显示的值
aggfunc = 值的聚合方式(默认的是求平均)
fill_value = 当出现nan值时，用什么填充
margins = 总计
margins_name = 总计的名称

首先导入测试数据

sale = pd.read_csv("sales_by_employee.csv", parse_dates=['Date']).head()
sale.nunique()

在这里插入图片描述

index字段

# index字段 作为行索引
sale.pivot_table(index='Date')

在这里插入图片描述

# index字段 多个字段作为多重索引
sale.pivot_table(index=['Date','Name'])
sale.pivot_table(index=['Name','Date'])

在这里插入图片描述

# index字段 多个字段作为多重索引,对调效果不同
sale.pivot_table(index=['Name','Date'])

在这里插入图片描述

columns字段

# columns字段 作为列索引
sale.pivot_table(index='Date', aggfunc="sum", columns='Name')

在这里插入图片描述

aggfunc字段

# aggfunc字段 聚合函数 默认是mean 平均值
# count 计数 sum 求和
sale.pivot_table(index='Date', aggfunc=["count","sum"])

在这里插入图片描述

# aggfunc 可以传入一个字典，对显示的值采取不同的聚合函数
sale.pivot_table(index='Date',                  
                 values=['Revenue','Expenses'],
                 columns='Name',
                 aggfunc={'Revenue':"sum", 'Expenses':"count"}
                )

在这里插入图片描述

values 字段、fill_value 字段

# values 字段 显示的栏目，多个栏目时也是使用列表形式，下面只显示Revenue
# fill_value 字段 当值为Nan时填充的值
sale.pivot_table(index='Date', 
                 aggfunc="sum", 
                 columns='Name',
                 values='Revenue',
                 fill_value=0
                )

在这里插入图片描述

margins 字段、margins_name 字段

# margins 字段 显示小计 默认=False
# margins_name 字段 显示小计的名称
sale.pivot_table(index='Date', 
                 aggfunc="sum", 
                 columns='Name',
                 values='Revenue',
                 fill_value=0.0,
                 margins=True,
                 margins_name='小计'             
                )

在这里插入图片描述

远行的人

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2.pandas应用 - 数据透视

pivot_table() 主要字段index = 行索引columns = 列索引values = 显示的值aggfunc = 值的聚合方式(默认的是求平均)fill_value = 当出现nan值时，用什么填充margins = 总计margins_name = 总计的名称
复制链接

扫一扫