转自https://blog.csdn.net/m0_51123132/article/details/121895075
注意一定要事先建立好存储的文件夹,不然会报错找不到路径,输出了半天才晓得问题出在哪里
# 把图片和标签同步对应乱序后输出到另外两个文件夹下
import os
import random
import re
import shutil
# 1 读取文件列表
image_dir = r'C:\Users\lxy\Desktop\data\data in project\image\\' # 一开始存放有图片的文件夹,你需要修改成你的文件夹名字
img_name_list = os.listdir(image_dir)
label_dir = r"C:\Users\lxy\Desktop\data\data in project\xml\\"
label_name_list = os.listdir(label_dir)
# 2 创建一个目标文件夹
result_dir = r'C:\Users\lxy\Desktop\data\data in project\result\\image\\' # 目标文件夹(最终存放乱序后的文件夹),会自动创建
result_label = r'C:\Users\lxy\Desktop\data\data in project\result\\xml\\'
if not os.path.exists(result_dir):
os.makedirs(result_dir)
print(f'创建文件夹{result_dir}成功!')
# 3 创建随机数
random_len = len(img_name_list)
img_index = [i for i in range(random_len)]
random.shuffle(img_index)
print(img_index)
# img_index
img_list = []
# 开始转移每个文件
for i, img in enumerate(img_name_list):
dot_index = img.find('.')
front = img.split('.')[0]
if dot_index > 0:
img_name = str(img_index[i]) +'_'+str(front)+ img[dot_index:]
img_list.append(img_name)
shutil.copyfile(image_dir + img, result_dir + img_name) # 如果你的磁盘不够大,那么这个copyfile要改成move,但是此时需要注意备份好原来的文件夹里的文件!
new_num = [x.split('.')[0] for x in label_name_list]
for i, value in enumerate( label_name_list):
num = img_list[i].split('_')[1].split('.')[0]
num_txt = img_list[i].split('.')[0]
#if(num in new_num):#如果有判断会丢失一些xml转不过去
#下面这句代码最后标签文件后缀是txt就是.txt 是json就是.json
shutil.copyfile(label_dir + value, result_label + num_txt+'.xml')
#else:
#print(num)