1、获得文件夹里表格目录
举例,我是获得本地 input 文件夹里得表格目录,如下代码:
input文件夹里共有9个xls格式得文件。
2、合并
# 创建一个空列表
df_list = []for table in tables:
table_lujing = path+'//'+table #获得表路径
df = pd.read_html(table_lujing)[0] # 注意原表格是 .xls格式,属于网页版,故用read_html函数调用数据#添加根据需要添加某一列,在此是在在第一列之后插入一列日期列。
col_name = df.columns.tolist() #取得列索引
col_name.insert(1,('日期','日期')) #在第一个索引之后添加日期名称
df=df.reindex(columns=col_name)
df['日期']= table #将日期列添加数值标注
df.drop(labels = df.index[-1],axis=0,inplace = True) # 删除多余的最后一行数据
df_list.append(df)# 合并一个文件夹里的表格数据
df_query = pd.DataFrame(columns=df_list[0].columns) #创建一个空的Dateframefor i in range(len(df_list)):
df_query = df_query.append(df_list[i])# 保存为以下路径,注意可选择保存格式
save_path = 'D:/A_projects/notebook_files/datas/input//'+'input.xlsx'
df_query.to_excel(save_path,encoding="utf_8_sig")
print('表格保存完毕')