环境的配置参见上一篇博客:Windows下的YOLOV4配置VS
进入到\darknet-master\build\darknet\x64\data目录新建一个自己装数据的文件夹,在里面新建如下几个文件夹annatations存放.xml文件,ImageSets里面再新建main文件夹,JPEGImages存放所有的图片,
我们对数据的处理就是将数据分为数据集、测试集、验证集,并将分好的图片数据对应的路径保存到一个txt文件中,方便训练测试的时候找到。
随机分测试机验证集的python脚本:
import os
import random
trainval_percent = 0.1
train_percent = 0.9
xmlfilepath = 'E:\...darknet-master\\build\\darknet\\x64\\data\\MyData\\Annatations' #修改为自己数据路径
txtsavepath = 'E:...darknet-master\\build\\darknet\\x64\\data\\MyData\\ImageSets\\Main'
total_xml = os.listdir(xmlfilepath)
num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)
ftrainval = open('E:...darknet-master\\build\\darknet\\x64\\data\\MyData\\ImageSets\\Main\\trainval.txt', 'w')
ftest = open('E:...darknet-master\\build\\darknet\\x64\\data\\MyData\\ImageSets\\Main\\test.txt', 'w')
ftrain = open('E:...arknet-master\\build\\darknet\\x64\\data\\MyData\\ImageSets\\Main\\train.txt', 'w')
fval = open('E:...darknet-master\\build\\darknet\\x64\\data\\MyData\\ImageSets\\Main\\val.txt', 'w')
for i in list:
name = total_xml[i][:-4] + '\n'
if i in trainval:
ftrainval.write(name)
if i in train:
ftest.write(name)
else:
fval.write(name)
else:
ftrain.write(name)
ftrainval.close()
ftrain.close()
fval.close()
ftest.close()
将数据随机分为了训练集,测试集,验证集,训练验证集。训练验证集=测试集+验证集。在main文件夹下面生成了四个txt文件。
下面就是将xml文件转化为yolov3的数据格式,并将各自图片的位置路径保存到txt文件,以便训练的时候,网络能够访问到图片。python脚本如下:
import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join
import sys
#源代码sets=[('2012', 'train'), ('2012', 'val'), ('2007', 'train'), ('2007', 'val'), ('2007', 'test')]
sets=[('myData', 'test')] # 改成自己建立的myData
classes = ["obj", "target"] # 改成自己的类别
def convert(size, box):
dw = 1./(size[0])
dh = 1./(size[1])
x = (box[0] + box[1])/2.0 - 1
y = (box[2] + box[3])/2.0 - 1
w = box[1] - box[0]
h = box[3] - box[2]
x = x*dw
w = w*dw
y = y*dh
h = h*dh
return (x,y,w,h)
def convert_annotation(year, image_id):
in_file = open('build\\darknet\\x64\data\\MyData\\Annatations\\%s.xml'%(image_id)) VOCdevkit/VOC%s/Annotations/%s.xml
out_file = open('build\\darknet\\x64\\data\\MyData\\labels\\%s.txt'%(image_id), 'w') # 改成自己的数据路径
tree=ET.parse(in_file)
root = tree.getroot()
size = root.find('size')
w = int(size.find('width').text)
h = int(size.find('height').text)
for obj in root.iter('object'):
difficult = obj.find('difficult').text
cls = obj.find('name').text
if cls not in classes or int(difficult)==1:
continue
cls_id = classes.index(cls)
xmlbox = obj.find('bndbox')
b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))
bb = convert((w,h), b)
out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')
wd = getcwd()
wd1 = sys.path[0]
for year, image_set in sets:
if not os.path.exists('build\\darknet\\x64\\data\\MyData\\labels\\'): # 改成自己建立的myData路径
os.makedirs('\\build\\darknet\\x64\\data\\MyData\\labels\\')
image_ids = open('\build\\darknet\\x64\\data\\MyData\\ImageSets\\Main\\%s.txt'%(image_set)).read().strip().split()
list_file = open('build\\darknet\\x64\\data\\MyData\\%s_%s.txt'%(year, image_set), 'w')
for image_id in image_ids:
list_file.write('%s\JPEGImages\%s.jpg\n'%(wd1, image_id)) #保存路径代码
print(wd)
print(wd1)
convert_annotation(year, image_id) #转化为yolo的数据格式
list_file.close()
到这里我们的myData文件下面会生成存放图片路径的txt文件
label文件夹下面会有各个图片对应的yolo格式的数据。
到这里我们数据处理就弄好了,后面就是改配置文件了。分别为voc.names,改为自己数据的类别的名字。
另外就是voc.data,分别改为保存图片路径的txt的路径
上面的两个文件都在data文件夹下面。
最后就是改cfg文件夹下面的网络结构配置文件
我的是两个类,所以filters数量改为21,计算公式为3*(5 + 类别数)=21,查找yolo需要改的地方有三个。
最后就是训练了。
下载预训练模型yolov4.weights到x64文件夹下面,命令行如下:
darknet.exe detector train data/voc.data cfg/yolov4.cfg yolov4.weights
详细的训练测试过程参照官网的readme:https://github.com/AlexeyAB/darknet