学习pandas数据透视表

1、excel中做数据透视表
1)步骤如下
① 选中整个数据源;

② 依次点击“插入”—“数据透视表”

③ 选择在Excel中的哪个位置,插入数据透视表

④ 然后根据实际需求,从不同维度展示结果

⑤ 结果如下

2、pandas中使用pivot_table()做数据透视表
1)语法格式
pd.pivot_table(data,index=None,columns=None,
values=None,aggfunc=‘mean’,
margins=False,margins_name=‘All’,
dropna=True,fill_value=None)
1
2
3
4
2)对比excel,说明上述参数的具体含义

参数说明:

data 相当于Excel中的"选中数据源";
index 相当于上述"数据透视表字段"中的行;
columns 相当于上述"数据透视表字段"中的列;
values 相当于上述"数据透视表字段"中的值;
aggfunc 相当于上述"结果"中的计算类型;
margins 相当于上述"结果"中的总计;
margins_name 相当于修改"总计"名,为其它名称;
下面几个参数,用的较少,记住干嘛的,等以后需要就百度。

dropna 表示是否删除缺失值,如果为True时,则把一整行全作为缺失值删除;
fill_value 表示将缺失值,用某个指定值填充。
3、案例说明
1)求出不同品牌下,每个月份的销售数量之和
① 在Excel中的操作结果如下

② 在pandas中的操作如下
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,“月份”,df[“销售日期”].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index=“品牌”,columns=“月份”,
values=“销售数量”,aggfunc=np.sum)
display(df1)
1
2
3
4
5
6
7
8
9
结果如下:

2)求出不同品牌下,每个地区、每个月份的销售数量之和
① 在Excel中的操作结果如下

② 在pandas中的操作如下
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,“月份”,df[“销售日期”].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index=“品牌”,columns=[“销售区域”,“月份”],
values=“销售数量”,aggfunc=np.sum)
display(df1)
1
2
3
4
5
6
7
8
9
结果如下:

3)求出不同品牌不同地区下,每个月份的销售数量之和
① 在Excel中的操作结果如下

② 在pandas中的操作如下
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,“月份”,df[“销售日期”].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index=[“品牌”,“销售区域”],columns=“月份”,
values=“销售数量”,aggfunc=np.sum)
display(df1)
1
2
3
4
5
6
7
8
9
结果如下:

4)求出不同品牌下的“销售数量之和”与“货号计数”
① 在Excel中的操作结果如下

② 在pandas中的操作如下
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,“月份”,df[“销售日期”].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index=“品牌”,columns=“月份”,
values=[“销售数量”,“货号”],
aggfunc={“销售数量”:“sum”,“货号”:“count”},
margins=True,margins_name=“总计”)
display(df1)
1
2
3
4
5
6
7
8
9
10
11
结果如下:

————————————————
版权声明:本文为CSDN博主「Huang supreme」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_41261833/article/details/104371241

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
pandas中,数据透视是一种可以对数据动态排布并且分类汇总的格格式,通过使用`pandas.pivot_table()`函数或`pandas.DataFrame.pivot_table()`函数来创建透视透视可以对数据进行各种计算操作,如求和、计数等,并根据不同的布局方式重新排列行号、列标和页字段。每次改变布局后,透视会重新计算数据。在使用Excel进行数据分析时,透视是非常常用的功能,Pandas提供了透视功能来满足类似的需求。 `pandas.pivot_table()`函数的主要参数有: - `data`: 数据源,即一个DataFrame对象 - `index`: 行索引,传入原始数据的列名 - `columns`: 列索引,传入原始数据的列名 - `values`: 要进行聚合操作的列名 - `aggfunc`: 聚合函数,用于对数据进行计算 而`pandas.DataFrame.pivot_table()`函数与`pandas.pivot_table()`函数相似,只是没有`data`参数,因为它是作为DataFrame对象的一个方法来使用的。 通过使用这些函数,我们可以创建数据透视来对数据进行分析和汇总。123 #### 引用[.reference_title] - *1* [python入门——Pandas透视(pivot_table)](https://blog.csdn.net/weixin_49249463/article/details/127578300)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}} ] [.reference_item] - *2* *3* [pandas 数据透视](https://blog.csdn.net/ljh18885466426/article/details/120048268)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值