YOLOv3-darknet训练自己的数据

最新推荐文章于 2024-07-30 09:31:25 发布

桃李醉东风

最新推荐文章于 2024-07-30 09:31:25 发布

阅读量665

点赞数 1

分类专栏：算法深度学习文章标签： yolov3 darknet

本文链接：https://blog.csdn.net/weixin_40877924/article/details/103620612

版权

深度学习同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

算法

3 篇文章 0 订阅

订阅专栏

1.linux常用命令常用的都有，点击查看

2.远程链接工具 mobaxterm下载

连接服务器:点击左上角的Session新建一个会话，在会话对话框中点击SSH,即可连接服务器，其中remote host填写远端服务器的地址，Specify username填写用户名，port填写端口，点击OK跳出终端，输入密码即可连接到服务器。
传输文件：点击左侧工具栏中的Sftp即可显示服务器中的文件，与平时的SFTP文件功能一致。不过传统的SFTP看图时需要下载到本地，该软件由于自带X Server，双击图片不用下载即可直接弹出。如果想要下载，右键download即可。

3.下载darknet

从github下载darknet-master文件夹,或者Windows下下载https://github.com/pjreddie/darknet然后上传服务器。

$ git clone https://github.com/pjreddie/darknet
$ cd darknet
$ make

然后运行下面的语句，会生成预测图像。如果成功了，说明你的darknet编译成功。

$ ./darknet detect cfg/yolov3.cfg yolov3.weights ./data/dog.jpg

可以编译出c版本的darknet,如果需要编译GPU版本、打开cudnn(cuDNN只是NVIDIA深度神经网络软件开发包中的其中一种加速库)、opencv(跨平台计算机视觉库)、openmp(for语句并行处理),可用gedit打开makefile，打开相应的项(注：opencv、cudnn需要另行安装，GPU、cudnn需要NVIDIA显卡)：

GPU=1
CUDNN=0
OPENCV=0
OPENMP=0
DEBUG=0

然后重新 make 编译一下。

用下面语句下载预训练模型。或者windows下在https://pjreddie.com/media/files/yolov3.weights网址直接下载，然后上传服务器。

wget https://pjreddie.com/media/files/yolov3.weights

你下载的模型应该在darknet根目录下。

然后运行下面的语句，会生成预测图像。如果成功了，说明你的darknet编译成功。

$ ./darknet detect cfg/yolov3.cfg yolov3.weights ./data/dog.jpg

4.在文件夹根目录新建myData文件夹，在myData文件夹下再新建四个文件夹，分别为annotations、ImageSets、JPEGImages，JSON。其中annotations文件下存放xml文件，ImageSets下新建main文件夹，JPEGImages下放要训练的图片。JSON文件夹放标注的json文件。

然后运行voc-label.py文件

运行utils.py文件

Annotations下为VOC格式的xml标注
如

<annotation>
    <folder>JPEGImages</folder>
    <filename>0a0a0b1a-7c39d841.jpg</filename>
    <path>/home/dew/CV2018/yolo/darknet/scripts/VOCdevkit/VOC2007/JPEGImages/0a0a0b1a-7c39d841.jpg</path>
    <source>
        <database>Unknown</database>
    </source>
    <size>
        <width>1280</width>
        <height>720</height>
        <depth>3</depth>
    </size>
    <segmented>0</segmented>
    <object>
        <name>car</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>557</xmin>
            <ymin>275</ymin>
            <xmax>688</xmax>
            <ymax>398</ymax>
        </bndbox>
    </object>
    <object>
        <name>car</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>160</xmin>
            <ymin>297</ymin>
            <xmax>252</xmax>
            <ymax>373</ymax>
        </bndbox>
    </object>
    <object>
        <name>car</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>392</xmin>
            <ymin>298</ymin>
            <xmax>459</xmax>
            <ymax>353</ymax>
        </bndbox>
    </object>
    <object>
        <name>car</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>492</xmin>
            <ymin>304</ymin>
            <xmax>523</xmax>
            <ymax>345</ymax>
        </bndbox>
    </object>
</annotation>

Main下txt文件为对应的测试、训练文件名称（不含后缀）
如：

0a0a0b1a-7c39d841

修改cfg/voc.data

classes= 1               #自己分类类别数
train  = /home/dew/Desktop/CV2018/yolo/darknet/scripts/2007_train.txt  #自己txt的路径
valid  = /home/dew/Desktop/CV2018/yolo/darknet/scripts/2007_val.txt    #自己txt的路径
names = data/voc.names      #分类名称
backup = backup             #生成的权重文件路径

修改cfg/yolov3-voc.cfg

查找带有[convolutional]以及[yolo]标签处（共3处）
修改

classes  = 标注种类数        //需要修改
filters=3*(classes+1+4)     //需要修改
ramdom=0  //显存足够1，不足够0

修改data/voc.names

备份后将内容修改为训练集classes名

下载预训练权重文件(只包含卷积层)或者windows下载https://pjreddie.com/media/files/darknet53.conv.74，然后上传服务器

wget https://pjreddie.com/media/files/darknet53.conv.74

并训练

./darknet detector train cfg/voc.data cfg/yolov3-voc.cfg darknet53.conv.74

log说明

Region xx: cfg文件中yolo-layer的索引；

Avg IOU:当前迭代中，预测的box与标注的box的平均交并比，越大越好，期望数值为1；

Class: 标注物体的分类准确率，越大越好，期望数值为1；

obj: 越大越好，期望数值为1；

No obj: 越小越好；

.5R: 以IOU=0.5为阈值时候的recall; recall = 检出的正样本/实际的正样本

0.75R: 以IOU=0.75为阈值时候的recall;

count:正样本数目。

log_output