当我们需要将一个exel表格文件通过列表值进行拆分时,实现的方式有很多,可以手工筛选再拆分,也可以用EXCEL做透视表等等。但是当重复次数多时,用自动化的手段完成就越能体现出高效率。
#第一步:调用pandas包并需要下载->pip install openpyxl
import pandas as pd
#第二步:读入文件
# keep_default_na设置nan为'',因为若值为nan,则在for循环内无法获取nan行的值
data = pd.read_excel('./data/data.xlsx',keep_default_na=False)
# 第三步:获取unit列表并去重
unit_list = list(data['unit'].drop_duplicates())
#第四步:按照类别分文件存放数据
for i in unit_list:
# 将数据筛选出来
data_new = data[data['unit'] == i]
# 测试查看数据
# print(data_new)
if i == '':
# index表示设置是否保存索引(就是行号), header表示设置是否保存表头(就是列名)!
data_new.to_excel('./data/文件拆分/空白.xlsx',index=False)
else:
data_new.to_excel('./data/文件拆分/%s.xlsx' % (i),index=False)