一、前言
最近刚结束一个项目,让我深刻明白“磨刀不误砍柴工”这个道理。这个项目需要批量处理Excel数据,要是人为的一个个去粘贴复制,非常的费时间,况且这个项目时间比较紧张,只给我几天的时间把模型需要的数据处理出来。这逼得我一个代码小白,广泛的去收罗各种处理excel数据的代码,虽然找代码、理解代码、改代码费了我一点时间,但是学会了后面的事情就是事半功倍的效果,做项目虽然很赶,但这种任务驱动型的学习还是让自己有所收获。废话不多说,下面就记录一些处理excel的代码,这些代码也是从各个博主中找到的,时间赶,太庞杂了,有些代码忘了出处了,后续找到了我会补充到文末的,侵删!!!
另外,我找代码的时候发现,大多数人贴了代码,也作了详尽的解释,但是很少有展示输入的数据是格式是怎样的,这也增加了我处理数据时间,因此这个帖子我会展示下输入和输出数据的效果是怎样的,希望对大家有所帮助。
二、代码
1、多个不同的Excel工作簿汇总到同一份工作簿里
每个工作簿的命名的开头相同,表格里面的表头相同。
(1)输入数据示例
(2)代码示例
import pandas as pd
import os
data_list = []
# os.listdir(".")返回目录中的文件名列表
# 用for循环遍历文件名列表中的每个文件名,赋值给变量filename
for filename in os.listdir("."):
# 判断文件名是否以"year-"开头并且以".xlsx"结尾
if filename.startswith("year_") and filename.endswith(".xlsx"):