【笔记】WIN10下YOLO V3训练自己的数据集

最新推荐文章于 2024-05-21 11:01:46 发布

wanpeng zhao

最新推荐文章于 2024-05-21 11:01:46 发布

阅读量1.5k

点赞数 4

分类专栏： yolo v3训练自己的数据集文章标签： yolo v3 训练数据集 win10

本文链接：https://blog.csdn.net/Bsummer/article/details/102644241

版权

yolo v3训练自己的数据集专栏收录该内容

0 篇文章 0 订阅

订阅专栏

【笔记】WIN10下YOLO V3训练自己的数据集

1、数据集

数据集格式整理
数据集建议放置于文件D:\darknet-master\build\darknet\x64\data下，文件夹组成形式如下：

其中：Annotations中是所有的xml文件；JPEGImages中是所有的训练图片；Main中是4个txt文件，其中test.txt是测试集，train.txt是训练集，val.txt是验证集，trainval.txt是训练和验证集。
补充数据集的txt文件
txt文件主要有两种：1、xml标定数据对应的txt文件。2、用于训练和验证的txt文件。
方法：下载voc_label.py文件，将文件下载到VOCdevkit同级的路径下。

# _*_ coding:utf-8 _*_
import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join

sets = [('2019', 'train'),('2019', 'test'),('2019', 'trainval'),('2019', 'val')]
classes = ["person"]

def convert(size, box):
    dw = 1. / size[0]
    dh = 1. / size[1]
    x = (box[0] + box[1]) / 2.0
    y = (box[2] + box[3]) / 2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return (x, y, w, h)

def convert_annotation(year, image_id):
    in_file = open('VOCdevkit/VOC%s/Annotations/%s.xml'%(year, image_id), encoding='UTF-8')
    out_file = open('VOCdevkit/VOC%s/labels/%s.txt'%(year, image_id), 'w')
    tree=ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)

    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))
        bb = convert((w,h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

wd = getcwd()

for year, image_set in sets:
    if not os.path.exists('VOCdevkit/VOC%s/labels/' % (year)):
        os.makedirs('VOCdevkit/VOC%s/labels/' % (year))
    image_ids = open('VOCdevkit/VOC%s/ImageSets/Main/%s.txt' % (year, image_set)).read().strip().split()
    print("image_ids",image_ids)
    list_file = open('%s_%s.txt' % (year, image_set), 'w')
    for image_id in image_ids:
        list_file.write('%s/VOCdevkit/VOC%s/JPEGImages/%s.jpg\n' % (wd, year, image_id))
        convert_annotation(year, image_id)
    list_file.close()
"""
for year, image_set in sets:
    if not os.path.exists('VOCdevkit/VOC%s/labels/'%(year)):
        os.makedirs('VOCdevkit/VOC%s/labels/'%(year))
    image_ids = open('VOCdevkit/VOC%s/ImageSets/Main/%s.txt'%(year, image_set)).read().strip().split()
    list_file = open('%s_%s.txt'%(year, image_set), 'w')
    for image_id in image_ids:
        list_file.write('%s/VOCdevkit/VOC%s/JPEGImages/%s.jpg\n'%(wd, year, image_id))
        convert_annotation(year, image_id)
    list_file.close()
"""

3、修改.cfg文件

将yolov3-head.cfg放置于D:\darknet-master\build\darknet\x64下：
修改.cfg文件：
在这里插入图片描述
将batch 改成64 ：batch=64

将subdivisions 改成8 ：subdivisions=8 在这里插入图片描述

将每个yolo下（共有3处）的classes改成你自己的类的数量：classes = 1（我的是1类）

将每个yolo上面第一个convolutional下的filters改成你自己的大小，计算方法是： filters=(classes + 5)x3 ,由于我的是1类，所以我的filters=18. （和上面一样，共有3处，3个yolo，每个yolo上面的第一个convolutional下的filters）每个yolo上面的第一个convolutional是网络的最后一个输出层。

！！！注意注意：如果你对显卡较差（4G显存以下），会出现内存溢出错误（Out of memory），改正方法：将batch改小些（64,32,16,8），将random改成0关闭多尺度训练。

4、修改.names文件

将文件放置于D:\darknet-master\build\darknet\x64\data下
在这里插入图片描述

5、修改.data文件

将文件放置于D:\darknet-master\build\darknet\x64\data下，内容如下：

classes= 1
train  = D:/darknet-master/build/darknet/x64/data/2019_test.txt
#valid  = D:/darknet-master/build/darknet/x64/data/2019_test.txt
#valid = data/coco_val_5k.list
names = D:/darknet-master/build/darknet/x64/data/voc-head.names
backup = backup/

6、执行训练命令

在D:\darknet-master\build\darknet\x64下执行命令：

darknet.exe detector train data/obj.data yolo-obj.cfg darknet53.conv.74  >> log/train_yolov3.log

wanpeng zhao

关注

4
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
【笔记】WIN10下YOLO V3训练自己的数据集

【笔记】WIN10下YOLO V3训练自己的数据集1、数据集数据集格式整理数据集建议放置于文件D:\darknet-master\build\darknet\x64\data下，文件夹组成形式如下：其中：Annotations中是所有的xml文件；JPEGImages中是所有的训练图片；Main中是4个txt文件，其中test.txt是测试集，train.txt是训练集，val.t...
复制链接

扫一扫