学习pandas数据透视表

最新推荐文章于 2023-07-14 12:41:56 发布

置顶 snow54678

最新推荐文章于 2023-07-14 12:41:56 发布

阅读量279

点赞数

原文链接：https://blog.csdn.net/weixin_41261833/article/details/104371241

版权

1、excel中做数据透视表
1）步骤如下
① 选中整个数据源；

② 依次点击“插入”—“数据透视表”

③ 选择在Excel中的哪个位置，插入数据透视表

④ 然后根据实际需求，从不同维度展示结果

⑤ 结果如下

2、pandas中使用pivot_table()做数据透视表
1）语法格式
pd.pivot_table(data,index=None,columns=None,
values=None,aggfunc=‘mean’,
margins=False,margins_name=‘All’,
dropna=True,fill_value=None)
1
2
3
4
2）对比excel，说明上述参数的具体含义

参数说明：

data 相当于Excel中的"选中数据源"；
index 相当于上述"数据透视表字段"中的行；
columns 相当于上述"数据透视表字段"中的列；
values 相当于上述"数据透视表字段"中的值；
aggfunc 相当于上述"结果"中的计算类型；
margins 相当于上述"结果"中的总计；
margins_name 相当于修改"总计"名，为其它名称；
下面几个参数，用的较少，记住干嘛的，等以后需要就百度。

dropna 表示是否删除缺失值，如果为True时，则把一整行全作为缺失值删除；
fill_value 表示将缺失值，用某个指定值填充。
3、案例说明
1）求出不同品牌下，每个月份的销售数量之和
① 在Excel中的操作结果如下

② 在pandas中的操作如下
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,“月份”,df[“销售日期”].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index=“品牌”,columns=“月份”,
values=“销售数量”,aggfunc=np.sum)
display(df1)
1
2
3
4
5
6
7
8
9
结果如下：

2）求出不同品牌下，每个地区、每个月份的销售数量之和
① 在Excel中的操作结果如下

② 在pandas中的操作如下
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,“月份”,df[“销售日期”].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index=“品牌”,columns=[“销售区域”,“月份”],
values=“销售数量”,aggfunc=np.sum)
display(df1)
1
2
3
4
5
6
7
8
9
结果如下：

3）求出不同品牌不同地区下，每个月份的销售数量之和
① 在Excel中的操作结果如下

② 在pandas中的操作如下
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,“月份”,df[“销售日期”].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index=[“品牌”,“销售区域”],columns=“月份”,
values=“销售数量”,aggfunc=np.sum)
display(df1)
1
2
3
4
5
6
7
8
9
结果如下：

4）求出不同品牌下的“销售数量之和”与“货号计数”
① 在Excel中的操作结果如下

② 在pandas中的操作如下
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,“月份”,df[“销售日期”].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index=“品牌”,columns=“月份”,
values=[“销售数量”,“货号”],
aggfunc={“销售数量”:“sum”,“货号”:“count”},
margins=True,margins_name=“总计”)
display(df1)
1
2
3
4
5
6
7
8
9
10
11
结果如下：

————————————————
版权声明：本文为CSDN博主「Huang supreme」的原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/weixin_41261833/article/details/104371241

snow54678

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
学习pandas数据透视表

1、excel中做数据透视表1）步骤如下① 选中整个数据源；② 依次点击“插入”—“数据透视表”③ 选择在Excel中的哪个位置，插入数据透视表④ 然后根据实际需求，从不同维度展示结果⑤ 结果如下2、pandas中使用pivot_table()做数据透视表1）语法格式pd.pivot_table(data,index=None,columns=None,values=None,...
复制链接

扫一扫