目标检测YOLOv5开源代码项目调试实战（数据处理模型训练）

最新推荐文章于 2024-09-12 17:54:53 发布

小海同学@

最新推荐文章于 2024-09-12 17:54:53 发布

阅读量527

点赞数 1

分类专栏：视觉学习（目标检测） python 文章标签： python 计算机视觉

小海同学

本文链接：https://blog.csdn.net/weixin_46608546/article/details/119487064

版权

本文介绍了如何使用Colabeler制作数据集，然后将标注导出为VOC模式。接着详细阐述了数据集的组织结构，包括创建Annotations和ImageSets文件夹，并将标注文件与图片对应。此外，通过编写Python脚本处理VOC数据，将其转化为可训练的格式。最终在Power_data目录下形成data数据集，为模型训练做好准备。注意图片和标注的名称及路径必须正确匹配。

摘要由CSDN通过智能技术生成

制作数据集

利用Colabeler可以制作数据集，对图片进行标注。在这里插入图片描述

导出voc模式

如图所示，标注完后，可以导出voc模式
在这里插入图片描述
准备好大量的数据之后，可以将数据集放在项目当中。在yolov5下面创建一个文件夹Power_data，在Power_data文件夹下面再建立一个标注文件夹Annotations，用来存放voc文件，建立ImageSets文件夹，用来存放图片，其中，图片名称和导出的voc名称需要一样，否则无法对应识别，把制作好的数据集复制粘贴进去即可。
在这里插入图片描述

数据集处理完毕之后，我们需要把voc的数据处理成如下，把x，y轴，长宽都提出来。

创建文件

我们在Power_data创建一个python文件，利用脚本转换
在这里插入图片描述
先运行split_train_val

# coding:utf-8

import os
import random
import argparse

parser = argparse.ArgumentParser()
#xml文件的地址，根据自己的数据进行修改 xml一般存放在Annotations下
parser.add_argument('--xml_path', default='Annotations', type=str, help='input xml label path')
#数据集的划分，地址选择自己数据下的ImageSets/Main
parser.add_argument('--txt_path', default='ImageSets/Main', type=str, help='output txt label path')
opt = parser.parse_args()

trainval_percent = 1.0
train_percent = 0.9
xmlfilepath = opt.xml_path
txtsavepath = opt.txt_path
total_xml = os.listdir(xmlfilepath)
if not os.path.exists(txtsavepath):
    os.makedirs(txtsavepath)

num = len(total_xml)
list_index = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list_index, tv)
train = random.sample(trainval, tr)

file_trainval = open(txtsavepath + '/trainval.txt', 'w')
file_test = open(txtsavepath + '/test.txt', 'w')
file_train = open(txtsavepath + '/train.txt', 'w')
file_val = open(txtsavepath + '/val.txt', 'w')

for i