把指定目录下好多长的一样的表纵向连在一起,然后再横向拼接相关信息
使用excel的操作是无数次Ctrl+c,Ctrl+V,若干次Vlookup
import pandas as pd
import os
#读取D:\XXX\YYY下面所有的excel文件,这些文件的表头是一样的
for root,dirs,files in os.walk (r"D:\XXX\YYY"):
df_data = pd.DataFrame()
for name in files:
path = os.path.join(root,name)
#print (path)
df_temp = pd.read_excel(path)
#print (df_temp)
#拼好的数据存在df_data中
df_data = pd.concat([df_data,df_temp])
#print (df_all)
#ZZZ为另外一张表,和df_data进行横向拼接,类似excel的vlookup
df_shangji = pd.read_excel(r"D:\XXX\ZZZ.xlsx")
#删除zzz和df_data的序号列
df_shangji=df_shangji.drop(["序号"],axis = 1)
df_data=df_data.drop(["序号"],axis = 1)
#以姓名为关键字,拼接
df_data = pd.merge(df_data,df_shangji,on = "姓名")
print(df_data)
df_data.to_excel(excel_writer = r"D:\XXX\AAA.xlsx")