YOLOv3+Tensorflow训练自己的数据集
最近在做一个用YOLOv3进行目标检测的项目,根据网上各位大神的博客,结合自己做项目的过程做了一个笔记,方便自己以后回顾实验过程,也给大家做个参考。
实验用的程序主代码来自于github上一位大神程序猿,这里给出代码的地址
YOLOv3-tensorflow大神源码
一、制作数据集
根据代码来看,训练和测试使用的数据格式需要按照PascalVOC的数据格式来,所以首先我们需要进行数据集的制作。
这里讲的比较笼统,更详细的制作步骤请参考我的另一篇文章:VOC数据集制作
1 获取数据
根据实验需要,我将录制的视频文件分为训练视频和测试视频,然后按帧进行截取,获得训练和测试用的图片,因为实验的保密性,在此不能说明具体的内容。将视频按帧截取为图片并保存使用的是下面这段代码:
import cv2
import glob
import os
from datetime import datetime
def video_to_frames(path):
"""
输入:path(视频文件的路径)
"""
# VideoCapture视频读取类
videoCapture = cv2.VideoCapture()
videoCapture.open(path)
for i in range(int(frames)):
ret, frame = videoCapture.read()
cv2.imwrite("E:\dataset\images\train%d.jpg" % (i), frame)
return
if __name__ == '__main__':
video_to_frames("E:\dataset\video\train.mp4")
print("SUCCEED !!!")
2 标记图片
根据PascalVOC数据集的需要,使用Labelimg工具对图片进行标注,标注后会生成XML文件,如下图所示:
3 按照PascalVOC数据集的格式整理自己的数据
这次实验我分别建立了VOCTrainval和VOCTest两个数据文件,分别用于训练和测试,大家也可以不分开,后面进行训练和测试数据划分就行了,两个文件夹都按照PascalVOC的格式建立。PascalVOC数据集包含了5个部分,在实验中我们只需要用到一下三个文件夹:
1) Annatations文件夹
文件夹存放的是xml格式的标签文件,每个xml文件都对应于JPEGImages文件夹的一张图片。
2)JPEGImages文件夹
文件夹里包含了训练图片或测试图片。
3)ImageSets文件夹
该文件夹里原有三个子文件夹,但实验中我们仅需要使用Main文件夹里面的信息,存放的是图像物体识别的数据,有train.txt, val.txt ,trainval.txt.这三个文件(VOCTrainval文件夹下)或者test.txt 文件(VOCTest)。这几个文件我们后面会生成。
按照要求,将自己的图片放入JPEGImages文件夹,将标注信息xml文件放入Annatations文件夹:
4 划分训练集和测试集
训练时要有测试集和训练集,如果在制作数据集的时候没有像我一样进行区分,那么在这里就需要使用代码将数据进行划分,放在ImageSets\Main文件夹下。代码如下,至于训练验证集和测试集的划分比例,以及训练集和验证集的划分比例,根据自己的数据情况决定。将下面的代码放入split.py中:
import os
import random
xmlfilepath=r'E:/tensorflow-yolov3-master/VOCData/VOCTrainVal/Annotations/' #xml文件的路径
saveBasePath=r'E:/tensorflow-yolov3-master/VOCData/VOCTrainVal/ImageSets/' #生成的txt文件的保存路径
trainval_percent=0.9
train_percent=0.8
total_xml = os.listdir(