YOLOv3+Tensorflow训练自己的数据

最新推荐文章于 2022-02-17 16:33:36 发布

MT_Lucky

最新推荐文章于 2022-02-17 16:33:36 发布

阅读量3.6k

点赞数 6

分类专栏：目标检测 YOLOv3 文章标签：深度学习 python 人工智能

本文链接：https://blog.csdn.net/qq_40927867/article/details/107080912

版权

本文详细介绍了使用YOLOv3进行目标检测的全过程，包括制作符合PascalVOC格式的数据集，修改配置文件，训练模型，以及进行图片和视频的测试。重点讲述了数据集的制作，如获取、标记图片，划分训练集和测试集，以及模型训练后的测试和性能评估。

摘要由CSDN通过智能技术生成

最近在做一个用YOLOv3进行目标检测的项目，根据网上各位大神的博客，结合自己做项目的过程做了一个笔记，方便自己以后回顾实验过程，也给大家做个参考。
实验用的程序主代码来自于github上一位大神程序猿，这里给出代码的地址
YOLOv3-tensorflow大神源码

一、制作数据集

根据代码来看，训练和测试使用的数据格式需要按照PascalVOC的数据格式来，所以首先我们需要进行数据集的制作。
这里讲的比较笼统，更详细的制作步骤请参考我的另一篇文章：VOC数据集制作

1 获取数据

根据实验需要，我将录制的视频文件分为训练视频和测试视频，然后按帧进行截取，获得训练和测试用的图片，因为实验的保密性，在此不能说明具体的内容。将视频按帧截取为图片并保存使用的是下面这段代码：

import cv2
import glob
import os
from datetime import datetime

def video_to_frames(path):
    """
    输入：path(视频文件的路径)
    """
    # VideoCapture视频读取类
    videoCapture = cv2.VideoCapture()
    videoCapture.open(path)
    for i in range(int(frames)):
        ret, frame = videoCapture.read()
        cv2.imwrite("E:\dataset\images\train%d.jpg" % (i), frame)
    return

if __name__ == '__main__':
    video_to_frames("E:\dataset\video\train.mp4")
    print("SUCCEED !!!")

2 标记图片

根据PascalVOC数据集的需要，使用Labelimg工具对图片进行标注，标注后会生成XML文件，如下图所示：
在这里插入图片描述

3 按照PascalVOC数据集的格式整理自己的数据

这次实验我分别建立了VOCTrainval和VOCTest两个数据文件，分别用于训练和测试，大家也可以不分开，后面进行训练和测试数据划分就行了，两个文件夹都按照PascalVOC的格式建立。PascalVOC数据集包含了5个部分，在实验中我们只需要用到一下三个文件夹：
1） Annatations文件夹
文件夹存放的是xml格式的标签文件，每个xml文件都对应于JPEGImages文件夹的一张图片。
2）JPEGImages文件夹
文件夹里包含了训练图片或测试图片。
3)ImageSets文件夹
该文件夹里原有三个子文件夹，但实验中我们仅需要使用Main文件夹里面的信息，存放的是图像物体识别的数据，有train.txt, val.txt ,trainval.txt.这三个文件（VOCTrainval文件夹下）或者test.txt 文件（VOCTest）。这几个文件我们后面会生成。
按照要求，将自己的图片放入JPEGImages文件夹，将标注信息xml文件放入Annatations文件夹：
在这里插入图片描述

4 划分训练集和测试集

训练时要有测试集和训练集，如果在制作数据集的时候没有像我一样进行区分，那么在这里就需要使用代码将数据进行划分，放在ImageSets\Main文件夹下。代码如下，至于训练验证集和测试集的划分比例，以及训练集和验证集的划分比例，根据自己的数据情况决定。将下面的代码放入split.py中：

import os  
import random   
  
xmlfilepath=r'E:/tensorflow-yolov3-master/VOCData/VOCTrainVal/Annotations/'  #xml文件的路径
saveBasePath=r'E:/tensorflow-yolov3-master/VOCData/VOCTrainVal/ImageSets/' #生成的txt文件的保存路径
  
trainval_percent=0.9 
train_percent=0.8  
total_xml = os.listdir(