用自己的数据集调试了YOLOV4,下面是按照运行顺序来写的对各函数的理解
1. voc2faster-rcnn.py
这个函数的功能是生成trainval.txt,train.txt,val.txt和test.txt,并将生成的文件存放在数据集的ImageSets/Main文件夹中,代码及其注释如下
import os
import random
xmlfilepath=r'./VOCtrain/VOC2007/Annotations' # 标记文件
saveBasePath=r"./VOCtrain/VOC2007/ImageSets/Main/" # 保存路径
trainval_percent=1 # 设置trainval和train数据的比例,通常trainval,train,val的比例为6:2:2
train_percent=0.9 # 我这里暂时数据不够,所以修改了比例
## 读取文件
temp_xml = os.listdir(xmlfilepath)
total_xml = []
for xml in temp_xml:
if xml.endswith(".xml"):
total_xml.append(xml)
num = len(total_xml) # 读取数据长度
list = range(num) # 生成长度为num的列表
tv = int(num*trainval_percent) # 计算trainval的数据数量
tr = int(tv*train_percent) # 计算train的数据数量
trainval = random.sample(list,tv) # 打乱列表顺序,随即排列;
train = random.sample(trainval,tr) # 训练时尽量打乱数据集的顺序,
# 因为我们自己标记的数据集,有时候连续的数据间会存在一定关系,影响和训练结果
## 显示 保存数据
print("train and val size",tv)
print("traub suze",tr)
ftrainval = open(os.path.join(saveBasePath,'trainval.txt'), 'w') # 设置个文件的保存路径和名称
ftest = open(os.path.join(saveBasePath,'test.txt'), 'w')
ftrain = open(os.path.join(saveBasePath,'train.txt'), 'w')
fval = open(os.path.join(saveBasePath,'val.txt'), 'w')
for i in list:
name=total_xml[i][:-4]+'\n'
if i in trainval: # 如果当前编号存在于trainval中,就把他写进trainval.txt文件
ftrainval.write(name)
if i in train: # 如果当前编号存在于trainval中且存在于train,就把他写进train.txt文件
ftrain.write(name)
else:
fval.write(name) # 如果存在于trainval但不在train中,就写进val
else:
ftest.write(name) # 如果不在trainval中,就写进test
ftrainval.close()
ftrain.close()
fval.close