程序来源:https://blog.csdn.net/qq_29462849/article/details/83301707
对程序进行了注释,并实测可用,分享如下
import os
import random
trainval_percent = 0.8 #整个数据集中,作为训练验证集的比例数
train_percent = 0.8 #训练验证集中用于训练的数据的比例,根据实际情况修改
xmlfilepath = 'T:\mademyself\Annotations' #注释文件的路径
txtsavepath = 'T:\mademyself\ImageSets\Main'#生成的txt文件的路径
total_xml = os.listdir(xmlfilepath) #得到整个注释文件的文件名
num=len(total_xml) #文件个数
list=range(num) #0到num
tv=int(num*trainval_percent) #训练验证文件的个数
tr=int(tv*train_percent) #训练文件的个数
trainval= random.sample(list,tv)#从0到num中随机选取tv个
train=random.sample(trainval,tr)#从trainval中随机选取tr个
ftrainval = open(txtsavepath+'/trainval.txt', 'w')#写模式打开trainval.txt,下同
ftest = open(txtsavepath+'/test.txt', 'w')
ftrain = open(txtsavepath+'/train.txt', 'w')
fval = open(txtsavepath+'/val.txt', 'w')
for i in list: #遍历文件
name=total_xml[i][:-4]+'\n' #取不带格式的文件名
if i in trainval: #分别写入不同的文件下
ftrainval.write(name)
if i in train:
ftrain.write(name)
else:
fval.write(name)
else:
ftest.write(name)
ftrainval.close()#关闭文件
ftrain.close()
fval.close()
ftest .close()