Yolo darknet训练自己的数据集教程(Newest 2016.12.23)

最新推荐文章于 2024-08-10 07:39:30 发布

qq_40525008

最新推荐文章于 2024-08-10 07:39:30 发布

阅读量881

点赞数

Yolo darknet训练自己的数据集教程(Newest 2016.12.23)

经过两天的折腾终于搞定了Yolo训练自己的数据集的过程，整个过程其实并不繁琐，只是网上一些过时的教程已经不适用了，依照那个反而让大家各种出出错，加之Yolo中文教程过少，因此本大神再次放一个，如果大家有任何问题直接在文章后面评论即可，笔者看到之后给予第一时间回复。

先插一句，Atom中文不能跟随窗口wrap文字的同学，打开settingview，设置soft wrap即可，百度上的答案真的是渣

Yolo简介

在训练数据集之前，相信大家对yolo应该有一些了解，本文所采用的测试环境为：Ubuntu 16.04 + opencv2.4 + cuda8 + cudnn5.1 PLUS GTX1080，当然这个硬件不是必须，在下只是偶尔装一下逼。Yolo基于darknet编写，而编译draknet的时候最好安装一下opencv，因为没有opencv图不会自动弹出，没有那种快感，你懂得，不知道如何安装opencv的同学去我之前写的几个博客中搜寻。均能够找到最新的答案。

yolo之所以快，是因为它的方法和fastrcnn以及其他detect算法不同，而采用了很多ssd的思想，在最新的更新中，yolo也改进了他们的算法，在pascal voc数据集上取得了不错的结果。本文将主要利用yolo来做realtime detect，对自己的数据进行训练和预测。

开始开车

OK，闲话不多说，让我们直接上车，这次是无人驾驶，速度比较快，大家系好安全带。

Step 1 编译darknet，并熟悉目录结构

第一部分没有什么说的，很简单其实，首先clone代码到本地~目录：

cd ~

git clone http s://github. com/pjreddie/darknet

cd darknet

make

这个时候我们在home根目录就有了darknet了。直接编译，不需要修改任何参数，当然如何你是土豪，你有GTX1080,像我一样（手动装比）。可以编译一下Makefile里面的参数。为了防止大家出错我还是说一下，直接改标志为：

GPU= 1

CUDNN= 1

OPENCV= 0

DEBUG= 0

如果你的cuda没有设置环境变量，nvcc的路径也设置一下：

NVCC= /usr/local /cuda/bin /nvcc

不要想的很复杂其实很简单。ok，现在直接make，编译就可以了。

Step 2 准备自己的数据集

好了我们现在有了darktnet，但是我要那个匡出物体的掉炸天的图怎么搞？莫慌，我们先用darknet自带的测试数据来测试一下。
首先呢，yolo这个网络是训练VOC数据集得来的，20中物体都能识别出来，我们直接下载已经训练好的权重然后来预测一张图片看看：

wget http: //pjreddie.com /media/files /yolo.weights

这时候我们就下载好了yolo.weights，在darknet目录下。然后我们就可以用这个权重来预测啦！

./darknet detect cfg/yolo .cfg yolo .weights data/dog.jpg

detect命令意思是，检测，后面还有i一个命令是detector train，后者是训练的命令，预测用detect，cfg/yolo.cfg就是yolo这个网络的结构文件，后面是权重，最后后面是图片。
ok，enter你就可以看到狗和自行车了！～
这就搞定了darknet，那么问题来了。自己的数据集怎么准备呢？
重点来了重点来了：

images 准备

首先，把你的图片放到一个/images 文件夹下面，文件名的名字要有规律，比如0001.jpg,0002.jpg….0100.jpg;

xml 准备

我相信很多人都需要用图片标注工具来对图片生成标注信息来训练，但是图片标注工具生成的多半是xml的标签信息。darknet需要的label并不是xml格式，而是一张图片一个txt的形式，txt中是你标注的物体方框坐标。后面我会放出几个脚本来处理。

xml 转 darknet label

xml转为darknet需要的label形式，一张图片一个标注信息。

生成图片路径
最后一部我们要生成两个txt文件，一个是train.txt,一个是valid.txt，train.txt包含了你训练图片需要的图片路径，没一行都是一张图片的路径，为了防止出错，后面我放出一个统一的脚本生成这个train.txt。

Step 3 训练之前修改darknet参数

接下来就要修改darknet的参数了，只要修改/cfg/voc.data 文件，因为yolo是为了voc而存在的，为了不修改源代码的情况下来训练我们的数据，建议直接修改voc.data而不是修改voc.data文件名。修改内容如下：

classes= 20

train = /home/pjreddie/data/voc/train.txt

valid = /home/pjreddie/data/voc/ 2007_test.txt

names = data/voc.names

backup = /home/pjreddie/backup/

这里，classes就是你数据集的类别，names你的新建一个，在data下面，然后在这里指向它，仿照voc.names 新建即可。
修改train.txt valid.txt的路径，用绝对路径哦，防止出错，因为你darknet和数据可能不再一个目录。
ok，这就setup完了，接着直接训练。
不过训练之前获取一个预处理的权重：

curl -O http: //pjreddie.com /media/files /darknet19_448.conv.23

然后，train：

./darknet detector train cfg/voc .data cfg/yolo-voc .cfg darknet19_448 .conv. 23

对了，如果你上面改了voc.data的文件名，这里也要改，所以说其实改也是可以的。然后yolo-voc.cfg就可以不改了。

Step 4 yolo训练出的模型预测

./darknet detect cfg/yolo-voc .cfg /backup/voc .weights data/sample.jpg

这里不要和直接copy我的代码，cfg/yolo-voc.cfg就是我们训练的网络。后面是训练保存的权重，最后是你要预测的图片。
OK，看看结果咋么样～