[YOLOv5]如何训练自己的数据集（GPU版）

最新推荐文章于 2024-08-24 10:37:39 发布

阿暖 .

最新推荐文章于 2024-08-24 10:37:39 发布

阅读量1.6w

点赞数 21

文章标签：深度学习计算机视觉

本文链接：https://blog.csdn.net/qq_44396101/article/details/117872115

版权

本文详细介绍了使用YOLOv5训练自定义数据集的完整步骤，包括下载项目、配置环境、准备VOC格式数据集、修改配置文件、模型训练、训练过程可视化和推理。重点讲解了数据集准备、权重下载、模型配置和训练参数设置，适合初学者参考。

摘要由CSDN通过智能技术生成

最近在用yolov5训练自己的数据集，期间走了不少的弯路，还被师兄无情diss，因此想记录一下这个过程，第一次写，如果有侵权，联系我可以删掉，如果有不对的地方，还请在评论区交流指正，谢谢大家！

1. 下载项目

源码链接：https://github.com/ultralytics/yolov5
其实官网上也有官方教程，大家想看的可以看一下

2. 配置环境

法1（官方）：只需要用终端打开项目文件，运行命令即可。

pip install -r requirements.txt

法2：由于pytorch不好安装的问题，官方方法可能会到torch的时候中断，所以可以提前自己安装好pytorch环境。然后注释掉requirements.txt文件中的torch，以及torchvision部分。再输入上述命令安装其余的包。
注意：yolov5要求python>=3.8,torch>=1.7。

3.准备数据集（VOC格式）

在下载好的yolov5项目文件夹下，创建文件夹VOCdevkit，在这个文件夹下，再建立文件夹VOC2007，然后在VOC2007下建立三个文件夹分别是：
JPEGImages：用来存放所有的图片
Annotations：用来存放图片所对应的标签文件
ImageSets：然后在Imagesets文件夹下创建文件夹Main，用来存放生成的train.txt, val.txt, trainval.txt, test.txt文件。

将图片以及标签文件放入相应的文件夹。
在VOC2007下创建test.py文件，代码如下（相对路径，无需修改，直接运行），他的作用是划分训练集和验证集，从而生成四个文件，也就是Main文件夹下的train.txt, val.txt, trainval.txt, test.txt。

import os
import random

trainval_percent = 0.1
train_percent = 0.9
xmlfilepath = 'Annotations'
txtsavepath = 'ImageSets\Main'
total_xml = os.listdir(xmlfilepath)

num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)

ftrainval = open('ImageSets/Main/trainval.txt', 'w')
ftest = open('ImageSets/Main/test.txt', 'w')
ftrain = open('ImageSets/Main/train.txt', 'w')
fval = open('ImageSets/Main/val.txt', 'w')

for i in list:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i