【python学习】如何批量从文件夹中根据文件后缀名提取文件,并存储到新的文件夹_electrochemjy的博客-CSDN博客_python从文件夹中提取文件
参考上面博主的内容,我要提取的是文件夹里面的图片,并且按照0.08的比例筛选
原博主的思路很清晰,适合新手读
''' 1.提前定义好存放所提取文件的文件夹 2.使用列表来放置想要提取的文件的文件后缀名 3.新建空的列表存放文件的路径 4.用os.walk来遍历文件夹 5.if判断后缀名是否符合条件,符合,则提取该文件的路径,放在列表中 6.用shutil.copy()将文件复制到新的文件夹中 ''' import os import shutil import random def filterfile(file_dir,save_dir,suffix): ''' 该函数实现从文件夹中根据文件后缀名提取文件,并存储在新的文件夹中 file_dir指读的文件目录;save_dir为保存文件的目录 suffix用于存放打算提取文件的后缀名; ''' if os.path.exists(save_dir): shutil.rmtree(save_dir) #如果已经存在该文件夹,移除 if not os.path.exists(save_dir): os.makedirs(save_dir) #如果不存在该文件夹,则创建,用于储存后续提取出来的文件 filelist = [] #存储要copy的文件全名 for dirpath,dirnames,filenames in os.walk(file_dir):#根据路径执行树状的遍历,分别遍历根目录,根目录下的文件夹,文件夹下的文件 for file in filenames:#遍历文件夹中的文件 file_type = file.split('.')[-1]#对文件名根据.进行分隔,实现文件名,后缀名的分离 if(file_type in suffix):#下面根据后缀名是否在列表中,提取文件 file_fullname = os.path.join(dirpath, file) #文件全名 filelist.append(file_fullname)#将符合要求的文件存放在列表中 for file in filelist: shutil.copy(file, save_dir)#将列表中的文件复制到新的文件夹 def moveFile(save_dir, trainDir): pathDir = os.listdir(save_dir) # 取图片的原始路径 filenumber = len(pathDir) rate1 = 0.08 # 自定义抽取csv文件的比例,比方说100张抽80张,那就是0.8 picknumber1 = int(filenumber * rate1) # 按照rate比例从文件夹中取一定数量的文件 sample1 = random.sample(pathDir, picknumber1) # 随机选取picknumber数量的样本 print(sample1) for name in sample1: shutil.move(save_dir + name, trainDir + "\\" + name) # for i in pathDir: # for j in sample1: # if(i!=j): # shutil.move(fileDir + name, testDir + "\\" + name) # shutil.copyfile(fileDir + name, tarDir + name) return if __name__ == "__main__": file_dir="E:/摄像头数据/20220421/" save_dir="E:/摄像头数据/20220421/1/" trainDir="E:/摄像头数据/20220421/2/" filterfile(file_dir,save_dir,['jpg']) moveFile(save_dir, trainDir)