YOLO源码详解（一）-训练

最新推荐文章于 2024-08-20 00:19:52 发布

木_凌

最新推荐文章于 2024-08-20 00:19:52 发布

阅读量4.4w

点赞数 24

分类专栏： YOLO源码详解 YOLO源码详解文章标签：源代码移植压缩 yolo cnn

本文链接：https://blog.csdn.net/u014540717/article/details/53114067

版权

本文作者木凌，2016年11月发布，详细讲解YOLO模型在darknet下的训练过程及源码解读。内容包括使用VOC2007数据集的训练步骤，数据转换，以及训练指令。此外，预告了YOLO的mxnet移植和模型压缩与加速等后续话题。

摘要由CSDN通过智能技术生成

本系列作者：木凌
时间：2016年11月。
文章连接：http://blog.csdn.net/u014540717
QQ交流群：554590241

本系列文章会持续更新，主要会分以下几个部分：
１、darknet下的yolo源代码解读
２、将yolo移植到mxnet下
３、模型压缩与加速
白天需要工作，只有晚上时间写，所以可能更新速度有点慢，还有就是该系列博文不一定会严格按照以上三点的顺序来写，也可能移植到caffe下，在caffe下进行压缩和加速。

一、训练

我用的是VOC2007的数据集，下载指令如下：

$curl -O http://pjreddie.com/media/files/VOCtrainval_06-Nov-2007.tar
$curl -O http://pjreddie.com/media/files/VOCtest_06-Nov-2007.tar
$tar xf VOCtrainval_06-Nov-2007.tar
$tar xf VOCtest_06-Nov-2007.tar

运行以下代码，将.xml 文件转换成.txt 文件，以备YOLO训练时数据解析：

import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join

sets=[('2007', 'train'), ('2007', 'val')]

classes = ["aeroplane", "bicycle", "bird", "boat", "bottle", "bus", "car", "cat", "chair", "cow", "diningtable", "dog", "horse", "motorbike", "person", "pottedplant", "sheep", "sofa", "train", "tvmonitor"]


def convert(size, box):
    dw = 1./size[0]
    dh = 1./size[1]
    x = (box[0] + box[1])/2.0
    y = (box[2] + box[3])/2.0
    w = box[1] - box[0]
    h = box[3</