目标效果:
--root_dir
---dir-1
001_xxx.jpg, 002_xxx.jpg,...
---dir-2
001_xxx.jpg, 002_xxx.jpg,...
import os
data_path = r"/data/dataset/xxx/naru_region_data/"
dir_list = sorted(os.listdir(data_path))
for idx, dirname in enumerate(dir_list):
filename_list = os.listdir(os.path.join(data_path, dirname))
prefix = "{:0>3d}-".format(idx + 1)
for filename in filename_list:
os.renames(os.path.join(data_path, dirname, filename), os.path.join(data_path, dirname, prefix + filename))
问题分析:遇到不是文件夹的文件会报错,可以在dir_list中优化一下,这里省事直接把报错文件删掉(用来检查数据集杂样本)
最终效果还行,但是要注意的是,xml和jpg的名字虽然改了,但是xml内容中的名字没有改变,因此导入至模型时需要注意,避免输入数据读取报错