将xlsx按照列分类并拆分成若干文件

PCGuo999

已于 2022-07-15 11:03:36 修改

阅读量611

点赞数

于 2022-07-15 10:58:31 首次发布

本文链接：https://blog.csdn.net/qq_44732742/article/details/125800070

版权

数据分析专栏收录该内容

3 篇文章 0 订阅

订阅专栏

当我们需要将一个exel表格文件通过列表值进行拆分时，实现的方式有很多，可以手工筛选再拆分，也可以用EXCEL做透视表等等。但是当重复次数多时，用自动化的手段完成就越能体现出高效率。

#第一步：调用pandas包并需要下载->pip install openpyxl
import pandas as pd
#第二步：读入文件
# keep_default_na设置nan为''，因为若值为nan，则在for循环内无法获取nan行的值
data = pd.read_excel('./data/data.xlsx',keep_default_na=False)
# 第三步：获取unit列表并去重
unit_list = list(data['unit'].drop_duplicates())
#第四步：按照类别分文件存放数据
for i in unit_list:
    # 将数据筛选出来
    data_new = data[data['unit'] == i]
    # 测试查看数据
    # print(data_new)
    if i == '':
        # index表示设置是否保存索引（就是行号）, header表示设置是否保存表头（就是列名）！
        data_new.to_excel('./data/文件拆分/空白.xlsx',index=False)
    else:
        data_new.to_excel('./data/文件拆分/%s.xlsx' % (i),index=False)