最近在用yolov5训练自己的数据集,期间走了不少的弯路,还被师兄无情diss,因此想记录一下这个过程,第一次写,如果有侵权,联系我可以删掉,如果有不对的地方,还请在评论区交流指正,谢谢大家!
1. 下载项目
源码链接:https://github.com/ultralytics/yolov5
其实官网上也有官方教程,大家想看的可以看一下
2. 配置环境
法1(官方):只需要用终端打开项目文件,运行命令即可。
pip install -r requirements.txt
法2:由于pytorch不好安装的问题,官方方法可能会到torch的时候中断,所以可以提前自己安装好pytorch环境。然后注释掉requirements.txt文件中的torch,以及torchvision部分。再输入上述命令安装其余的包。
注意:yolov5要求python>=3.8,torch>=1.7。
3.准备数据集(VOC格式)
在下载好的yolov5项目文件夹下,创建文件夹VOCdevkit,在这个文件夹下,再建立文件夹VOC2007,然后在VOC2007下建立三个文件夹分别是:
JPEGImages:用来存放所有的图片
Annotations:用来存放图片所对应的标签文件
ImageSets:然后在Imagesets文件夹下创建文件夹Main,用来存放生成的train.txt, val.txt, trainval.txt, test.txt文件。
将图片以及标签文件放入相应的文件夹。
在VOC2007下创建test.py文件,代码如下(相对路径,无需修改,直接运行),他的作用是划分训练集和验证集,从而生成四个文件,也就是Main文件夹下的train.txt, val.txt, trainval.txt, test.txt。
import os
import random
trainval_percent = 0.1
train_percent = 0.9
xmlfilepath = 'Annotations'
txtsavepath = 'ImageSets\Main'
total_xml = os.listdir(xmlfilepath)
num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)
ftrainval = open('ImageSets/Main/trainval.txt', 'w')
ftest = open('ImageSets/Main/test.txt', 'w')
ftrain = open('ImageSets/Main/train.txt', 'w')
fval = open('ImageSets/Main/val.txt', 'w')
for i in list:
name = total_xml[i][:-4] + '\n'
if i in trainval:
ftrainval.write(name)
if i