在深度学习模型训练前期,经常会对各种文件进行操作,在这里会对XML、MAT、NII、json、csv、cfg、txt等常用的文件操作做一个总结
1、文件名前缀匹配
def find_FISH_file(self, project_path, flag="FISH-CAC"):
file_names = os.listdir(project_path)
fish_flag = 0
for i, file_name in enumerate(file_names):
ret = re.findall(flag, file_name)
if ret:
return file_name, []
else:
fish_flag += 1
if fish_flag == len(file_names):
loss_file = ['FISH-CAC-XXXX']
return [], loss_file
2、获取文件夹下莫后缀文件列表
def get_images(file_dir, suffix='jpg'):
file_list = []
# filename_list = []
files = os.listdir(file_dir)
for file in files:
if file.endswith(suffix):
# filename = os.path.join(file_dir, file)
file_list.append(file)
# filename_list.append(file)
return file_list # , filename_list
3、新建文件夹
def dir_process(path):
if not os.path.exists(path):
os.mkdir(path)
else:
shutil.rmtree(path)
os.mkdir(path)
return path + '/'
后续有时间会接着总结一些文件操作