制作数据集
利用Colabeler可以制作数据集,对图片进行标注。
导出voc模式
如图所示,标注完后,可以导出voc模式
准备好大量的数据之后,可以将数据集放在项目当中。在yolov5下面创建一个文件夹Power_data,在Power_data文件夹下面再建立一个标注文件夹Annotations,用来存放voc文件,建立ImageSets文件夹,用来存放图片,其中,图片名称和导出的voc名称需要一样,否则无法对应识别,把制作好的数据集复制粘贴进去即可。
数据集处理完毕之后,我们需要把voc的数据处理成如下,把x,y轴,长宽都提出来。
创建文件
我们在Power_data创建一个python文件,利用脚本转换
先运行split_train_val
# coding:utf-8
import os
import random
import argparse
parser = argparse.ArgumentParser()
#xml文件的地址,根据自己的数据进行修改 xml一般存放在Annotations下
parser.add_argument('--xml_path', default='Annotations', type=str, help='input xml label path')
#数据集的划分,地址选择自己数据下的ImageSets/Main
parser.add_argument('--txt_path', default='ImageSets/Main', type=str, help='output txt label path')
opt = parser.parse_args()
trainval_percent = 1.0
train_percent = 0.9
xmlfilepath = opt.xml_path
txtsavepath = opt.txt_path
total_xml = os.listdir(xmlfilepath)
if not os.path.exists(txtsavepath):
os.makedirs(txtsavepath)
num = len(total_xml)
list_index = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list_index, tv)
train = random.sample(trainval, tr)
file_trainval = open(txtsavepath + '/trainval.txt', 'w')
file_test = open(txtsavepath + '/test.txt', 'w')
file_train = open(txtsavepath + '/train.txt', 'w')
file_val = open(txtsavepath + '/val.txt', 'w')
for i