作者: 锋小刀
微信搜索【Python与Excel之交】关注我的公众号查看更多内容
Hi~大家好,又到Python偷懒时刻。
今天讲解的是如何利用Python来按需求批量提取EXCEL表格数据,然后进行保存。在用excel进行工作时,这样的操作在日常办公中是经常会用到,而用Python实现将会大大提高工作效率!
需求描述
本文新建了一个excel文件让案例更具有普遍性,文件共有十二个工作表,包括12个月的销售记录:
需求如下:
- 提取表格中名为锋小刀的销售员的销售记录
- 提取表格中销售额超过2000的销售记录
- 提取表格中名为锋小刀的销售员且销售额超过2000的销售记录
- 筛选除锋小刀的销售记录
- 计算各个销售员的销售总额
- 取出每个月1号的销售记录
- 按以上需求为名称重命名工作表名称
- 按原工作簿中的工作表名称+总表.xslx保存为多个excel文件
简单的说就是创建12个excel工作簿,工作簿中包含6个需求为名称的工作表,工作表里面保存着需求数据。
代码实现
导入pandas模块。
import pandas
我们需要先读取工作簿中的所有工作表,然后再进行一个一个工作表的数据提取。
这里 sheet_name=None
不指定工作表,利用循环遍历 df_name.keys()
取出所有工作表名称,然后把工作表名称放入df中的sheet_name
,一个一个的打开工作表:
df_name = pd.read_excel('2021年销售员销售记录.xlsx', sheet_name=None)
for i in df_name.keys():
df = pd.read_excel('2021年销售员销售记录.xlsx', sheet_name=i)
提取表格中名为锋小刀的销售员的销售记录,只要 销售员列
出现锋小刀
的销售员提取出来:
df1 = df[df[