本文记录工作中常遇到的几种Excel文件合并的情景,实际运到问题可以直接运行程序,输入要合并的文件所在的路径就可以实现自动合并,提升工作效率。
情形一:Excel属于同一文件夹下
#同一文件夹下多个Excel合并
import pandas as pd
import os
#文件路径
file_dir = input('请输入合并Excel文件所在的位置路径:')
#构建新的表格名称
new_filename = file_dir + '\\new_file.xlsx'
#找到文件路径下的所有表格名称,返回列表
file_list = os.listdir(file_dir)
new_list = []
for file in file_list:
#重构文件路径
file_path = os.path.join(file_dir,file)
#将excel转换成DataFrame
dataframe = pd.read_excel(file_path)
#保存到新列表中
new_list.append(dataframe)
#多个DataFrame合并为一个
df = pd.concat(new_list)
#写入到一个新excel表中
df.to_excel(new_filename,index=False)
情形二:Excel属于不同文件夹下
#多个文件夹下Excel合并
import pandas as pd
import os
#文件路径
file_dir = input('请输入合并Excel文件所在文件夹的路径:')
#构建新的表格名称
new_filename = file_dir + '\\new_file.xlsx'
#找到文件路径下的所有表格名称
file_list = os.walk(file_dir)
new_list = []
for dir_path,dirs,files in file_list:
for file in files:
#重构文件路径
file_path = os.path.join(dir_path,file)
#将excel转换成DataFrame
df = pd.read_excel(file_path)
new_list.append(df)
#多个DataFrame合并为一个
df = pd.concat(new_list)
#写入到一个新excel表中
df.to_excel(new_filename,index=False)
情形三:Excel合并并将文件名单独添加一列
#同一文件夹下多个Excel合并,并将文件名作为新的一列
import pandas as pd
import os
#文件路径
file_dir = input('请输入合并Excel文件所在的位置路径:')
#构建新的表格名称
new_filename = file_dir + '\\new_file.xlsx'
#找到文件路径下的所有表格名称,返回列表
file_list = os.listdir(file_dir)
new_list = []
for file in file_list:
#重构文件路径
file_path = os.path.join(file_dir,file)
#将excel转换成DataFrame
dataframe = pd.read_excel(file_path)
#处理文件名
big_class = file.split('_')[1]
dataframe['bigclass'] = big_class
#保存到新列表中
new_list.append(dataframe)
#多个DataFrame合并为一个
df = pd.concat(new_list)
#写入到一个新excel表中
df.to_excel(new_filename,index=False)