对比excel,学习pandas数据透视表

1、excel中做数据透视表

1)步骤如下
① 选中整个数据源;

在这里插入图片描述

② 依次点击“插入”—“数据透视表”

在这里插入图片描述

③ 选择在Excel中的哪个位置,插入数据透视表

在这里插入图片描述

④ 然后根据实际需求,从不同维度展示结果

在这里插入图片描述

⑤ 结果如下

在这里插入图片描述

2、pandas中使用pivot_table()做数据透视表

1)语法格式
pd.pivot_table(data,index=None,columns=None,
               values=None,aggfunc='mean',
               margins=False,margins_name='All',
               dropna=True,fill_value=None)
2)对比excel,说明上述参数的具体含义

在这里插入图片描述
参数说明:

  • data 相当于Excel中的"选中数据源";
  • index 相当于上述"数据透视表字段"中的行;
  • columns 相当于上述"数据透视表字段"中的列;
  • values 相当于上述"数据透视表字段"中的值;
  • aggfunc 相当于上述"结果"中的计算类型;
  • margins 相当于上述"结果"中的总计;
  • margins_name 相当于修改"总计"名,为其它名称;

下面几个参数,用的较少,记住干嘛的,等以后需要就百度。

  • dropna 表示是否删除缺失值,如果为True时,则把一整行全作为缺失值删除;
  • fill_value 表示将缺失值,用某个指定值填充。

3、案例说明

1)求出不同品牌下,每个月份的销售数量之和
① 在Excel中的操作结果如下

在这里插入图片描述

② 在pandas中的操作如下
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index="品牌",columns="月份",
                     values="销售数量",aggfunc=np.sum)
display(df1)

结果如下:
在这里插入图片描述

2)求出不同品牌下,每个地区、每个月份的销售数量之和
① 在Excel中的操作结果如下

在这里插入图片描述

② 在pandas中的操作如下
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index="品牌",columns=["销售区域","月份"],
                     values="销售数量",aggfunc=np.sum)
display(df1)

结果如下:
在这里插入图片描述

3)求出不同品牌不同地区下,每个月份的销售数量之和
① 在Excel中的操作结果如下

在这里插入图片描述

② 在pandas中的操作如下
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index=["品牌","销售区域"],columns="月份",
                     values="销售数量",aggfunc=np.sum)
display(df1)

结果如下:
在这里插入图片描述

4)求出不同品牌下的“销售数量之和”与“货号计数”
① 在Excel中的操作结果如下

在这里插入图片描述

② 在pandas中的操作如下
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index="品牌",columns="月份",
                     values=["销售数量","货号"],
                     aggfunc={"销售数量":"sum","货号":"count"},
                     margins=True,margins_name="总计")
display(df1)

结果如下:
在这里插入图片描述

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数据分析与统计学之美

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值