python提取excel表中指定行和列的数据_实例41_Python分类汇总278张Excel表中的数据...

去年共有278天领用了物料,记录在278张Excel表中。现在,老板想将所有物料按领用量从高到低排序,以便查看前10种领用最多的物料的情况。如果手工操作,需要把每张工作表的内容合并在一起,再用数据透视表来做。而对于这种重复操作,Phthon最擅长。我们可以用 实例22 的方法用Python将所有工作表合在一起,再用数据透视表操作。

但Python还有个功能强大的pandas(Python Data Analysis Library)库,专门用于做数据分析。它包含很多数据处理的函数和方法,可帮助我们快捷高效地处理数据。现在,我们就来演示如何用pandas统计一个Excel工作簿中278张表的数据并汇总,排序。我们先导入pandas库,为方便后续简化书写,大家都习惯于给它起个小名叫pd

import pandas as pd

然后我们先用pd.read_excel()打开第一张工作表,试试水,打开后存入变量df。传入要打开的工作簿,即'日领料单.xlsx'。数据的字段名在第三行,指定header=2。因为header是用0表示第一行,所以第三行对应的索引为2。第一张表的名称叫01-03,所以指定参数sheet_name = '01-03'。打开后,用df.head()看一下效果,这个函数值看头几行数据,括号内不填具体数量,则默认头五行。相对应的,df.tail()则是看末尾5行。

2897bca062a3ddc2fa62ea5ffef5b7bc.png

df = pd.read_excel('日领料单.xlsx' ,header=2, sheet_name = '01-03')
df.head()

ffa2deb1fe4af4dcf4086445509f2247.png

数据显示与Excel表中完全一致,那就可以开始下一步了,即按照“物料编号”和“物料描述”字段将“批号批数量”加总。这里将使用到groupby(),它的作用是分组聚合,有点类似数据透视表中的“行”。此处我们按“物料编号”和“物料描述”分组聚合数据,并按“批号批数量”加总['批号批数量'].sum()。因为汇总数据后,行会减少(从191行减少到163行),所以需要重设行编号reset_index(),按0~162重新编号。

#按物料编号加总领料数量
df_sum = df.groupby(['物料编号
  • 3
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值