【Python自动化Excel】pandas处理Excel的拆分、合并

字节杂谈

已于 2022-05-19 10:47:13 修改

阅读量7.7k

点赞数 6

分类专栏： pandas 自动化办公 python 文章标签： python 数据分析

于 2022-03-31 09:29:41 首次发布

本文链接：https://blog.csdn.net/kingwsq/article/details/123863300

版权

话说Excel数据表，分久必合、合久必分。Excel数据表的“分”与“合”是日常办公中常见的操作。手动操作并不困难，但数据量大了之后，重复性操作往往会令人崩溃。利用Python的Pandas库，便可以自动实现Excel数据表的“分分合合”。下面结合实例来分享本人整理的实用代码片段。（如有更好的方式，欢迎批评指正）

主目录

分：纵向“分”

从数据平台（如问卷平台）中导出的数据往往是清单型的，每一行都是一条记录，数据量大的时候，表格往往是很“长”的。有时需要按照某列的不同数值，将一个总表“分”成单独的一些Excel文件。

纵向“分”原理图

一个工作表“分”为多个Excel文件

def to_excelByColName(sourceDf,colName,outPath,excelName):
    '''
        纵向“分”：一个工作表“分”为多个Excel文件
        根据指定的列名中的不同值，分解Excel，并存储成多个Excel文件。
        sourceDf：原始的DataFrame
        colName：指定列名
        outPath：输出路径
        excelName：文件名，加.xlsx后缀
    '''
    colNameList = sourceDf[colName].drop_duplicates().tolist()
    for eachColName in colNameList:
        sourceDf[sourceDf[colName]==eachColName].to_excel('/'.join([outPath,eachColName+excelName]),index=False)

例如：将20个班级1000名学生的总表，按班级分成20个Excel文件。

调用to_excelByColName函数，效果如下：

to_excelByColName(sourceDf = sourceDf,colName="班级",outPath=".\分班数据表",excelName="生成数据表.xlsx")

纵向分，演示效果

一个工作表“分”为一个文件的多个sheet

def to_excelByColNameWithSheets(sourceDf

最低0.47元/天解锁文章

字节杂谈

关注

6
点赞
踩
77

收藏

觉得还不错? 一键收藏
0
评论
【Python自动化Excel】pandas处理Excel的拆分、合并

话说Excel数据表，分久必合、合久必分。Excel数据表的“分”与“合”是日常办公中常见的操作。手动操作并不困难，但数据量大了之后，重复性操作往往会令人崩溃。利用Python的Pandas库，便可以自动实现Excel数据表的“分分合合”。下面结合实例来分享本人整理的实用代码片段。
复制链接

扫一扫

专栏目录