假设这样一个场景,当你作为公司总部经理,需要收集各地方业务部的销售数据,并且汇总分析。你的分公司如果数量不多,简单的复制粘贴即可以完成需求,假设你的分公司多达成百上千,那么每次汇总可能就要花费你几小时的时间。使用Python来进行自动化的表格汇总,可以直接解放你的所有时间。
创建模拟数据
我们使用xlwings这个python库,可以直连你的excel表格,我们先随机产生一些表格数据。
# 产生随机数据
column_names = ['部门', '销售量']
for i in range(10):
book = app.books.add()
book.sheets[0].range('A1').value = column_names
book.sheets[0].range('A2').value = [['部门{}'.format(j + 1), random.randint(1, 100)] for j in range(100)]
name = '地区{}.xlsx'.format(i + 1)
book.save('excel_data/{}'.format(name))
app.books[name].close()
合并表格
接下来,我们读取每个地区的数据,合并至汇总表格。合并十个表格,每个表格100条数据,大概需要5s,时间非常短,并且你不需要进行任何中间操作,可以批量自动化运行
# 初始化结果excel
result = app.books.add()
result.sheets[0].range('A1').value = ['地区', '部门', '销售量']
last_row_num = 2
filenames = [x for x in os.listdir('excel_data') if x.endswith('.xlsx')]
for f in filenames:
# 读取数据
book = app.books.open('excel_data/{}'.format(f))
data = book.sheets[0].range('A2').expand().value
data = [[f.replace('.xlsx', '')] + x for x in data]
# 写入数据
result.sheets[0].range('A{}'.format(last_row_num)).value = data
last_row_num += len(data)
book.close()
# 保存结果
name = '汇总.xlsx'
result.save(name)
app.books[name].close()
完整代码请查看https://github.com/anorakj/python_excel