如何用python循环合并文件?
1.获取文件路径
2.筛选xlsx类型的文件
3.append纵向合并
如何获取文件路径导入程序包
import os
import pandas as pd
import numpy as np
文件“外貌”
用os.walk遍历某个目录下的所有文件
r=[]
d=[]
f=[]
for root, dirs, files in os.walk("G:\\20200804金师兄\\上市公司年报\\公告分类关联表"):
r.append(root) # 当前目录路径
d.append(dirs) # 当前路径下所有子文件夹
f.append(files) # 当前路径下所有非子文件夹的文件
print(f)打出所有非子文件夹的文件名
g="G:\\20200804金师兄\\上市公司年报\\公告分类关联表"#跟目录名称
import os
l1=[]
l2=[]
for root,dirs,files in os.walk(g):
for dir in dirs:
l=os.path.join(root,dir)
l1.append(l)
for file in files:
s=os.path.join(root,file)
l2.append(s)
#l2是所有文件,l1是所有文件夹
获取文件名
for i in l2:
name=os.path.split()[1]
print(name)
#split可以将文件路径和文件名分开
获取文件路径并合并g=0
for i in l2:
i1=os.path.splitext(i)[1] #分离拓展名
if i1==".xlsx": #筛选出拓展名为xlsx的文件
dfg=pd.read_excel(i)
g+=1
print(g)
df=df.append(dfg)#将拓展名为xlsx的文件合并
else:
continue