darknet yolov3 数据集weights文件训练

最新推荐文章于 2024-06-25 21:30:00 发布

wangjianweivip

最新推荐文章于 2024-06-25 21:30:00 发布

阅读量1.9k

点赞数

分类专栏： yolov3

本文链接：https://blog.csdn.net/wangjianweivip/article/details/117327558

版权

yolov3 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

yolov3数据集训练
看文章之前建议去官网看看 https://pjreddie.com/darknet/

上面是比较官方的做法
下面是自己看别人的文章做出来的数据集

安装python环境

这参考https://www.runoob.com/python/python-install.html
建议安装3.65版本

用labelimg个图片打标签

下载 git clone https://github.com/tzutalin/labelImg
使用方法
1双击labelImg.exe
在这里插入图片描述

执行一些python脚本生成一些训练需要的 txt文件

建好文件夹结构，一定要这样的文件夹结构，后面的python脚本需要用到
在这里插入图片描述

import os
import random

trainval_percent = 0.1
train_percent = 0.9
xmlfilepath = 'Annotations'
txtsavepath = 'ImageSets\Main'
total_xml = os.listdir(xmlfilepath)
num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)

ftrainval = open('ImageSets/Main/trainval.txt', 'w')
ftest = open('ImageSets/Main/test.txt', 'w')
ftrain = open('ImageSets/Main/train.txt', 'w')
fval = open('ImageSets/Main/val.txt', 'w')

for i in list:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftest.write(name)
        else:
            fval.write(name)
    else:
        ftrain.write(name)

ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

保存为test.py
执行 py test.py

import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join
sets=[('2007', 'train'), ('2007', 'val'), ('2007', 'test')] # 生成三个文件
classes = ["bz","qt"]#修改成自己的标签类名称,
def convert(size, box):
    dw = 1./(size[0])
    dh = 1./(size[1])
    x = (box[0] + box[1])/2.0 - 1
    y = (box[2] + box[3])/2.0 - 1
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x*dw
    w = w*dw
    y = y*dh
    h = h*dh
    return (x,y,w,h)

def convert_annotation(year, image_id):
    in_file = open('VOC%s/Annotations/%s.xml'%(year, image_id))
    out_file = open('VOC%s/labels/%s.txt'%(year, image_id), 'w')
    tree=ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)

    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult)==1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))
        bb = convert((w,h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

wd = getcwd()

for year, image_set in sets:
    if not os.path.exists('VOC%s/labels/'%(year)):#文件夹的路径 注意修改
        os.makedirs('VOC%s/labels/'%(year))#文件夹的路径 注意修改
    image_ids = open('VOC%s/ImageSets/Main/%s.txt'%(year, image_set)).read().strip().split()#文件夹的路径 注意修改
    list_file = open('%s_%s.txt'%(year, image_set), 'w')#文件夹的路径 注意修改
    for image_id in image_ids:
        list_file.write('%s/VOC%s/JPEGImages/%s.png\n'%(wd, year, image_id))#文件夹的路径 注意修改
        convert_annotation(year, image_id)#文件夹的路径 注意修改
    list_file.close()

os.system("2007_train.txt 2007_val.txt 2007_train.txt 2007_val.txt > train.txt") #文件夹的路径 注意修改

保存为voc_label.py
执行 py voc_label.py 命令

cfg文件配置说明

有俩中cfg文件
一种是 yolov3-tiny.cfg（小版本的）
另一种是 yolov3.cfg（正常版本的）
可以用vs打开.cfg文件
修改
在这里插入图片描述
Ctrl+F 查找yolo 正常的有3处 tiny有俩处，注意每处都需要替换，
另外anchors的合适参数需要执行 darknet.exe detector calc_anchors dataO\obj.data -num_of_clusters 5 -width 1472 -height 1472 才能获取的到这个应该改是选取尺寸有关系的

在这里插入图片描述

自己用到的一些命令说明

coco.data 文件说明
classes= 2 #标签种类数
train = dataO/2007_train.txt #训练文件
valid = dataO/2007_val.txt # 验证文件
names = dataO/obj.name # 种类名称
backup = backup/ #生成权重文件的存放地址
eval=coco

1 修改anchors darknet.exe detector calc_anchors dataO\obj.data -num_of_clusters 5 -width 1472 -height 1472
2 提取模型 darknet.exe partial dataO\yolov3.cfg dataO\yolov3.weights dataO\darknet53.conv.74 74
3 训练 darknet.exe detector train VOCDevkit\coco.data（这文件） VOCDevkit\yolov3-tiny.cfg VOCDevkit\yolov3-tiny.conv.15
4 测试
darknet.exe detect yolov3.cfg(配置文件) weights\yolov3.weights(权重文件) data\dog.jpg(测试的图片)

cfg参数说明

.cfg参数很多也比较重要目前这些参数的调整理解的还不是很深所以就在网上找了点

[net]                        ★ [xxx]开始的行表示网络的一层，其后的内容为该层的参数配置，[net]为特殊的层，配置整个网络
# Testing                    ★ #号开头的行为注释行，在解析cfg的文件时会忽略该行
# batch=1
# subdivisions=1
# Training
batch=64                     ★ 这儿batch与机器学习中的batch有少许差别，仅表示网络积累多少个样本后进行一次BP 
subdivisions=16              ★ 这个参数表示将一个batch的图片分sub次完成网络的前向传播
                             ★★ 敲黑板：在Darknet中，batch和sub是结合使用的，例如这儿的batch=64，sub=16表示训练的过
                             程中将一次性加载64张图片进内存，然后分16次完成前向传播，意思是每次4张，前向传播的循环过程中
                             累加loss求平均，待64张图片都完成前向传播后，再一次性后传更新参数
                             ★★★ 调参经验：sub一般设置16，不能太大或太小，且为8的倍数，其实也没啥硬性规定，看着舒服就好
                             batch的值可以根据显存占用情况动态调整，一次性加减sub大小即可，通常情况下batch越大越好，还需
                             注意一点，在测试的时候batch和sub都设置为1，避免发生神秘错误！
 
width=608                    ★ 网络输入的宽width
height=608                   ★ 网络输入的高height
channels=3                   ★ 网络输入的通道数channels 3为RGB彩色图片，1为灰度图，4为RGBA图，A通道表示透明度
                             ★★★ width和height一定要为32的倍数，否则不能加载网络
                             ★ 提示：width也可以设置为不等于height，通常情况下，width和height的值越大，对于小目标的识别
                             效果越好，但受到了显存的限制，读者可以自行尝试不同组合
                             
momentum=0.9                 ★ 动量 DeepLearning1中最优化方法中的动量参数，这个值影响着梯度下降到最优值的速度
decay=0.0005                 ★ 权重衰减正则项，防止过拟合,decay参数越大对过拟合的抑制能力越强
 
angle=5                      ★ 数据增强参数，通过旋转角度来生成更多训练样本，生成新图片的时候随机旋转-5~5度
saturation = 1.5             ★ 数据增强参数，通过调整饱和度来生成更多训练样本，饱和度变化范围1/1.5到1.5倍
exposure = 1.5               ★ 数据增强参数，通过调整曝光量来生成更多训练样本，曝光量变化范围1/1.5到1.5倍
hue=.1                       ★ 数据增强参数，通过调整色调来生成更多训练样本，色调变化范围-0.1~0.1 
 
learning_rate=0.001          ★ 学习率决定着权值更新的速度，设置得太大会使结果超过最优值，太小会使下降速度过慢。
                             如果仅靠人为干预调整参数，需要不断修改学习率。刚开始训练时可以将学习率设置的高一点，
                             而一定轮数之后，将其减小在训练过程中，一般根据训练轮数设置动态变化的学习率。
                             刚开始训练时：学习率以 0.01 ~ 0.001 为宜。一定轮数过后：逐渐减缓。
                             接近训练结束：学习速率的衰减应该在100倍以上。
                             学习率的调整参考https://blog.csdn.net/qq_33485434/article/details/80452941
                             ★★★ 学习率调整一定不要太死，实际训练过程中根据loss的变化和其他指标动态调整，手动ctrl+c结
                             束此次训练后，修改学习率，再加载刚才保存的模型继续训练即可完成手动调参，调整的依据是根据训练
                             日志来，如果loss波动太大，说明学习率过大，适当减小，变为1/5，1/10均可，如果loss几乎不变，
                             可能网络已经收敛或者陷入了局部极小，此时可以适当增大学习率，注意每次调整学习率后一定要训练久
                             一点，充分观察，调参是个细活，慢慢琢磨
                             ★★ 一点小说明：实际学习率与GPU的个数有关，例如你的学习率设置为0.001，如果你有4块GPU，那
                             真实学习率为0.001/4
burn_in=1000                 ★ 在迭代次数小于burn_in时，其学习率的更新有一种方式，大于burn_in时，才采用policy的更新方式
max_batches = 500200         ★ 训练次数达到max_batches后停止学习，一次为跑完一个batch
 
policy=steps                 ★ 学习率调整的策略：constant, steps, exp, poly, step, sig, RANDOM，constant等方式
                             参考https://nanfei.ink/2018/01/23/YOLOv2%E8%B0%83%E5%8F%82%E6%80%BB%E7%BB%93/#more
steps=400000,450000          
scales=.1,.1                 ★ steps和scale是设置学习率的变化，比如迭代到400000次时，学习率衰减十倍，45000次迭代时，学
                             习率又会在前一个学习率的基础上衰减十倍
 
[convolutional]              ★ 一层卷积层的配置说明
batch_normalize=1            ★ 是否进行BN处理，什么是BN此处不赘述，1为是，0为不是 
filters=32                   ★ 卷积核个数，也是输出通道数
size=3                       ★ 卷积核尺寸
stride=1                     ★ 卷积步长
pad=1                        ★ 卷积时是否进行0 padding,padding的个数与卷积核尺寸有关，为size/2向下取整，如3/2=1
                             # 如果pad为0,padding由 padding参数指定。如果pad为1，padding大小为size/2
activation=leaky             ★ 网络层激活函数
                             ★★ 卷积核尺寸3*3配合padding且步长为1时，不改变feature map的大小
                             
# Downsample
[convolutional]              ★ 下采样层的配置说明
batch_normalize=1
filters=64
size=3
stride=2
pad=1
activation=leaky             ★★ 卷积核尺寸为3*3，配合padding且步长为2时，feature map变为原来的一半大小
 
[shortcut]                   ★ shotcut层配置说明
from=-3                      ★ 与前面的多少次进行融合，-3表示前面第三层
activation=linear            ★ 层次激活函数包括，logistic, loggy, relu, elu, relie, plse, hardtan, lhtan, linear, 
                             ramp, leaky, tanh, stair
    ......
    ......
[convolutional]              ★ YOLO层前面一层卷积层配置说明
size=1
stride=1
pad=1
filters=255                  ★ 每一个[region/yolo]层前的最后一个卷积层中的 filters=(classes+5)*anchors_num,其中
                             5的意义是4个坐标加一个置信率，即论文中的tx,ty,tw,th,to
                             anchors_num 是该层mask的一个值.如果没有mask则 anchors_num=num
                             classes为类别数，COCO为80,num表示YOLO中每个cell预测的框的个数，YOLOV3中为3
                             ★★★ 自己使用时，此处的值一定要根据自己的数据集进行更改，例如你识别80个类，则：
                             filters=3*(80+5)=255,三个fileters都需要修改，切记
activation=linear
 
[yolo]                       ★ YOLO层配置说明
mask = 0,1,2                 ★  使用anchor的索引，0，1，2表示使用下面定义的anchors中的前三个anchor
anchors = 10,13,  16,30,  33,23,  30,61,  62,45,  59,119,  116,90,  156,198,  373,326   
                             ★ 预测框的初始宽高，第一个是w，第二个是h，总数量是num*2,YOLOv2作者说anchors是使用K-MEANS
                             获得，其实就是先统计出哪种大小的框比较多,可以增加收敛速度,如果不设置anchors,默认是0.5;
classes=80                   ★ 类别数目
num=9                        ★ 每个grid cell总共预测几个box,和anchors的数量一致。当想要使
                             用更多anchors时需要调大num，且如果调大num后训练时Obj趋近0的话
                             可以尝试调大object_scale
jitter=.3                    ★ 数据增强手段，此处jitter为随机调整宽高比的范围，通过抖动增加噪声来抑制过拟合
                             [?]利用数据抖动产生更多数据，YOLOv2中使用的是crop，filp，以及net层的angle，flip是随机的，
					         jitter就是crop的参数，tiny-yolo-voc.cfg中jitter=.3，就是在0~0.3中进行crop
ignore_thresh = .7
truth_thresh = 1             ★ 参与计算的IOU阈值大小.当预测的检测框与ground true的IOU大于ignore_thresh的时候，参与
                             loss的计算，否则，检测框的不参与损失计算。
                             ★ 理解：目的是控制参与loss计算的检测框的规模，当ignore_thresh过于大，接近于1的时候，那么参与
                             检测框回归loss的个数就会比较少，同时也容易造成过拟合；而如果ignore_thresh设置的过于小，那么
                             参与计算的会数量规模就会很大。同时也容易在进行检测框回归的时候造成欠拟合。
                             ★ 参数设置：一般选取0.5-0.7之间的一个值，之前的计算基础都是小尺度（13*13）用的是0.7，
                             （26*26）用的是0.5。这次先将0.5更改为0.7。参考：https://www.e-learn.cn/content/qita/804953
random=1                     ★ 为1打开随机多尺度训练，为0则关闭
                             ★★ 提示：当打开随机多尺度训练时，前面设置的网络输入尺寸width和height其实就不起作用了，width
                             会在320到608之间随机取值，且width=height，每10轮随机改变一次，一般建议可以根据自己需要修改
                             随机尺度训练的范围，这样可以增大batch，望读者自行尝试！

wangjianweivip

关注

0
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
darknet yolov3 数据集weights文件训练

yolov3数据集训练看文章之前建议去官网看看 https://pjreddie.com/darknet/上面是比较官方的做法下面是自己看别人的文章做出来的数据集安装python环境这参考https://www.runoob.com/python/python-install.html建议安装3.65版本用labelimg个图片打标签下载 git clone https://github.com/tzutalin/labelImg使用方法1双击labelImg.exe执行一些pyt
复制链接

扫一扫