制作VOC2007格式数据集并训练YOLOv3权重文件

最新推荐文章于 2024-08-05 11:19:50 发布

Andyoyo007

最新推荐文章于 2024-08-05 11:19:50 发布

阅读量3.4k

点赞数 3

分类专栏：机器学习深度学习 Linux

本文链接：https://blog.csdn.net/qq_25349629/article/details/87556981

版权

Linux 同时被 3 个专栏收录

16 篇文章 0 订阅

订阅专栏

深度学习

4 篇文章 0 订阅

订阅专栏

机器学习

3 篇文章 0 订阅

订阅专栏

１下载darknet并编译测试

(1) 下载darknet源码并编译

git clone https://github.com/pjreddie/darknet
cd darknet

如果使用CPU，直接

make

如果使用GPU，需要先修改Makefile文件，修改部分如下

GPU=1
CUDNN=1
...
NVCC=/usr/local/cuda/bin/nvcc

然后

make

(2) 运行demo进行测试
先下载权重文件

wget https://pjreddie.com/media/files/yolov3.weights

若下载太慢，可移步百度网盘，链接: https://pan.baidu.com/s/1hQqFMvGxs2lTJZBrf9E6XQ 提取码: dbup
然后运行demo

./darknet detect cfg/yolov3.cfg yolov3.weights data/dog.jpg

2 制作VOC2007格式数据集

首先，按照VOC2007数据集格式创建相应文件夹，例如：

/home/xxx/darknet/VOCdevkit/VOC2007/

并在VOC2007目录下创建以下４个目录：Annotations、ImageSets、JPEGImages、labels
然后在Annotations目录下创建Main目录
创建好上述目录结构后，将自己准备的数据集图片(分辨率为416*416)拷贝到JPEGImages目录下，并最好按照VOC2007数据集格式命名，例如：000001.jpg
此处附一段文件重命名批处理python代码：

# -*- coding:utf8 -*-

import os

class BatchRename():
    '''
    批量重命名文件夹中的图片文件

    '''
    def __init__(self):
        self.path = '/home/xxx/darknet/VOCdevkit/VOC2007/JPEGImages'  #表示需要命名处理的文件夹

    def rename(self):
        filelist = os.listdir(self.path) #获取文件路径
        total_num = len(filelist) #获取文件长度（个数）
        i = 1  #表示文件的命名是从1开始的
        for item in filelist:
            if item.endswith('.png'):  #初始的图片的格式为jpg格式的（或者源文件是png格式及其他格式，后面的转换格式就可以调整为自己需要的格式即可）
                src = os.path.join(os.path.abspath(self.path), item)
                #dst = os.path.join(os.path.abspath(self.path), ''+str(i) + '.jpg')#处理后的格式也为jpg格式的，当然这里可以改成png格式
                dst = os.path.join(os.path.abspath(self.path), '000' + format(str(i), '0>3s') + '.jpg')    #这种情况下的命名格式为000000.jpg形式，可以自主定义想要的格式
                try:
                    os.rename(src, dst)
                    print ('converting %s to %s ...' % (src, dst))
                    i = i + 1
                except:
                    continue
        print ('total %d to rename & converted %d jpgs' % (total_num, i))

if __name__ == '__main__':
    demo = BatchRename()
    demo.rename()

样本图片准备好之后，利用labelImg对样本图片进行标注。下载 labelImg 并运行

git clone https://github.com/tzutalin/labelImg.git
cd labelImg
sudo apt-get install pyqt5-dev-tools
sudo pip3 install lxml
make qt5py3
python3 labImage.py

具体操作请参考github地址：https://github.com/tzutalin/labelImg　
注意　打好标签后保存.xml文件到Annotations目录
所有样本图像打完标签后，生成样本集、测试集等：
在VOC2007目录下创建python脚本文件gen.py

import os  
import random  

trainval_percent = 0.5  
train_percent = 0.5  
xmlfilepath = 'Annotations'  
txtsavepath = 'ImageSets/Main'  
total_xml = os.listdir(xmlfilepath)  

num=len(total_xml)  
list=range(num)  
tv=int(num*trainval_percent)  
tr=int(tv*train_percent)  
trainval= random.sample(list,tv)  
train=random.sample(trainval,tr)  

ftrainval = open(txtsavepath+'/trainval.txt', 'w')  
ftest = open(txtsavepath+'/test.txt', 'w')  
ftrain = open(txtsavepath+'/train.txt', 'w')  
fval = open(txtsavepath+'/val.txt', 'w')  

for i  in list:  
    name=total_xml[i][:-4]+'\n'  
    if i in trainval:  
        ftrainval.write(name)  
        if i in train:  
            ftrain.write(name)  
        else:  
            fval.write(name)  
    else:  
        ftest.write(name)  

ftrainval.close()  
ftrain.close()  
fval.close()  
ftest .close()

运行该脚本

python3 gen.py

会在ImageSets/Main目录下生成以下文件：test.txt、train.txt、trainval.txt、val.txt

下载格式转换文件，生成YOLO要用的VOC标签格式：

cd darknet
wget https://pjreddie.com/media/files/voc_label.py
gedit voc_label.py

修改voc_label.py文件

# 修改年份
sets=[('2007', 'train'), ('2007', 'val'), ('2007', 'test')]
# 修改检测的物体种类为自己需要检测的类别
classes = ["flotage"]

运行voc_label.py完成转换

python3 voc_label.py

运行后会在darknet目录下生成2007_test.txt、2007_train.txt、2007_val.txt三个文件，此处将train和val的数据一起用来训练，因此将其合并为train.txt。

cat 2007_train.txt 2007_val.txt > train.txt

3 制作修改相应文件等

(1) 修改.names文件
进入darknet/data目录，复制该目录下的voc.names文件，命名为xxx.names，并将其中的内容修改为自己要检测的目标类别名
(2) 修改.data文件
进入darknet/cfg目录，复制该目录下的voc.data文件，命名为xxx.data，并进行如下修改：

classes= 1  # 自己数据集的类别数
train  = /home/xxx/darknet/train.txt  # train文件的路径
valid  = /home/xxx/darknet/2007_test.txt   # test文件的路径
names = data/xxx.names
backup = backup

注意　要看darknet目录下是否有backup目录，若没有，需要新建该目录
(3) 修改.cfg文件
进入darknet/cfg目录，复制该目录下的yolo3-voc.cfg文件，命名为xxx.cfg，并进行如下修改(标#注释处为修改的地方)：

注释掉文件开头的Testing,取消对Training的注释，如下所示

[net]
# Testing
# batch=1           #
# subdivisions=1    #
# Training
 batch=64           #
 subdivisions=16    #

[convolutional]
size=1
stride=1
pad=1
filters=18   #3*(classes+1+4)
activation=linear

[yolo]
mask = 0,1,2
anchors = 10,13,  16,30,  33,23,  30,61,  62,45,  59,119,  116,90,  156,198,  373,326
classes=1     #classes
num=9
jitter=.3
ignore_thresh = .5
truth_thresh = 1
random=1    #1，如果显存很小，将random设置为0，关闭多尺度训练

注意　该修改有３处，即[yolo]层中的classes和其上一个[convolutional]卷积层的filters

4 下载预训练权重文件

cd darknet
wget https://pjreddie.com/media/files/darknet53.conv.74

5 进行训练

历经千辛万苦，终于可以开始训练自己的数据集啦！

./darknet detector train cfg/xxx.data cfg/xxx.cfg darknet53.conv.74

耐心等待，生成的权重文件存储在backup目录下

参考文献
https://blog.csdn.net/helloworld1213800/article/details/79749359

Andyoyo007

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

制作VOC2007格式数据集并训练YOLOv3权重文件

１ 下载darknet并编译测试

2 制作VOC2007格式数据集

3 制作修改相应文件等

4 下载预训练权重文件

5 进行训练

１下载darknet并编译测试