从文件夹中根据文件后缀名提取文件,并存储到新的文件夹
下面,我有这样一个大文件夹,大文件夹中有很多小的文件夹,小的文件夹中有很多文件。我需要的是小文件夹中有特定后缀名的文件,我想把它们都提取出来。主要用到os.walk()函数。
例如,我需要将以下目录中的文件夹,提取每份文件夹中后缀名为outmol,car的文件,并存放在新的文件夹。详情见下:
1.在“test_exps”文件夹下有很多子文件夹
2.每一份文件夹中均有很多文件,我需要提取的是后缀名为outmol,car的文件
3.将从子文件夹中提取的文件存储在新的文件夹“new_test_exps”中
【代码思想】
- 提前定义好用于存放所提取文件的文件夹
- 使用列表放好想要提取文件的文件后缀名
- 新建空的列表用于存放提取文件的路径
- 使用os.walk()函数对文件夹进行遍历
- 使用for循环遍历子文件夹下的文件名,并使用split()函数根据“.”对文件名字符串进行分隔,分隔为[文件名,后缀名]
- 使用if判据,判断后缀名是否符合条件,如果符合,则提取该文件的路径,存放在列表中
- 接着使用shutil.copy()函数将文件复制到新的文件夹中
import os
import shutil
def filterfile(file_dir,save_dir,suffix):
'''
该函数实现从文件夹中根据文件后缀名提取文件,并存储在新的文件夹中
file_dir指读的文件目录;save_dir为保存文件的目录
suffix用于存放打算提取文件的后缀名;
'''
if os.path.exists(save_dir):
shutil.rmtree(save_dir) #如果已经存在该文件夹,移除
if not os.path.exists(save_dir):
os.makedirs(save_dir) #如果不存在该文件夹,则创建,用于储存后续提取出来的文件
filelist = [] #存储要copy的文件全名
for dirpath,dirnames,filenames in os.walk(file_dir):#根据路径执行树状的遍历,分别遍历根目录,根目录下的文件夹,文件夹下的文件
for file in filenames:#遍历文件夹中的文件
file_type = file.split('.')[-1]#对文件名根据.进行分隔,实现文件名,后缀名的分离
if(file_type in suffix):#下面根据后缀名是否在列表中,提取文件
file_fullname = os.path.join(dirpath, file) #文件全名
filelist.append(file_fullname)#将符合要求的文件存放在列表中
for file in filelist:
shutil.copy(file, save_dir)#将列表中的文件复制到新的文件夹
if __name__ == "__main__":
filterfile("check_for_3Np1Ng","filterfrom_check_for_3Np1Ng",['car','outmol'])