目录
前言
遇到了批量合并根目录下大量不同格式文件并进行简单处理的需求,在网上没有搜到完全相同的处理,谨在此分享自己不成熟的代码,请大佬们批评指正。
一、代码展示
import os
import pandas as pd
import numpy as np
path =r"文件路径"
#文件所在的根目录
file_name = []
frames = []
print('以下文件未进行合并:\n')
for root,dirs,files in os.walk(path):
#遍历根目录下的每一个文件
for file in files:
if file[-3:]== 'xls' or file[-4:]== 'xlsx':
file_name.append(file)
df = pd.read_excel(os.path.join(root,file),skiprows = 0)
#将excel导入数据库,如需跳过行在skiprows中体现
df['数据批次'] = file[:-5]
#为数据库增加以文件名命名的数据批次列
frames.append(df)
else:
print(file,'未合并')