YOLO 算法的自定义数据集制作及模型训练方法（附代码）

Incalos

已于 2023-07-23 16:35:12 修改

阅读量9.4k

点赞数 22

分类专栏：机器视觉文章标签： YOLO 深度学习计算机视觉目标检测图像处理

于 2023-04-07 17:04:40 首次发布

本文链接：https://blog.csdn.net/m0_67394827/article/details/130007483

版权

机器视觉专栏收录该内容

3 篇文章

订阅专栏

本文章主要涉及以下工作：
   （1）详细介绍了怎样制作YOLO的自定义数据集以及如何使用自定义数据集训练YOLO模型。
   （2）对YOLOv5、YOLOv6、YOLOv7、YOLOv8进行了部分修改，能够适配自定义数据集进行训练。
   （3）提供了各YOLO算法的目标检测模型的预训练权重。
   （4）提供了项目的 Python 代码以及相应的使用文档。
如果文章有用，欢迎各位→点赞👏 + 收藏💞 + 留言🔔 😁🌹🌹
项目代码：YOLO-Datasets-And-Training-Methods
如果项目代码有用，请给Github项目star一下，谢谢啦 😁🌹🌹

1. 制作自定义数据集

（1）采集数据

如果使用 Intel RealSense 双目相机采集图像，可以查看 使用 Intel RealSense 采集图片并制作机器视觉数据集。

（2）安装并启动标注工具

打开终端，输入以下命令完成标注工具 labelimg 的安装。
```
pip install labelimg -i https://pypi.tuna.tsinghua.edu.cn/simple
```
在终端输入 labelimg，启动 labelimg，出现如下所示的界面。

在这里插入图片描述

（3）配置标注工具

在 View 菜单中找到 Auto Save mode，点击 Auto Save mode 将标注过程设置成自动保存模式。

在这里插入图片描述

设置数据集格式，选择 PascalVOC。

在这里插入图片描述

（4）标注数据

建议YOLO的自定义数据集设置成如下的目录结构。其中 YoloDataSets 为数据集的根目录，images 文件夹内放置待标注的图片，Annotations 文件夹内放置标注工具生成的标签。

YoloDataSets/
 |——————images/
 |        └——————1.jpg
 |        └——————2.jpg  
 |        └——————3.jpg
 |        └——————...
 |——————Annotations/
 |        └——————1.xml
 |        └——————2.xml  
 |        └——————3.xml
 |        └——————...

点击 Open Dir 选择 images 文件夹，打开待标注的图片。
点击 Change Save Dir 选择 Annotations 文件夹，将标签保存在 Annotations 文件夹。
开始标图，详细过程如下。

在这里插入图片描述

（5）将VOC格式数据集转换成YOLO格式数据集

将标注好的数据集按以下结构保存。

YoloDataSets/
 |——————images/
 |        └——————1.jpg
 |        └——————2.jpg  
 |        └——————3.jpg
 |        └——————...
 |——————Annotations/
 |        └——————1.xml
 |        └——————2.xml  
 |        └——————3.xml
 |        └——————...

在终端输入以下命令，运行 DataSet.py。

python DataSet.py --yoloversion yolov5 --trainval_percent 0.9 --train_percent 0.9 --mainpath YoloDataSets --classes ['dog','man']
                                yolov6                    ···                ···             ····                   ['','',···]
                                yolov7                    ···                ···             ····                   ['','',···]
                                yolov8                    ···                ···             ····                   ['','',···]

各参数含义如下。
- yoloversion : YOLO的版本，这里可供选择 YOLOv5、YOLOv6、YOLOv7、YOLOv8
- trainval_percent : 训练集和验证集的总占比，即 1-trainval_percent 为测试集占比
- train_percent : 训练集在训练集和验证集中的占比
- mainpath : 自定义数据集的根目录
- classes : 待检测标签的名称，请按照示例以列表的格式填写

2. 训练YOLO算法

（1）YOLOv5的训练方法

在终端输入如下命令，进入 yolov5 文件夹。
```
cd yolov5
```
将转换后的数据集放在 yolov5 的根目录下。

在 YoloDataSets 目录下添加 .yaml 配置文件 data.yaml ，内容和格式如下。

path : YoloDataSets
train: train.txt
val: val.txt
test: test.txt

# number of classes
nc: 2

# class names
names: ['dog','man']

在终端运行如下命令，参数按实际情况进行调整。

python train.py --data YoloDataSets/data.yaml --epochs 300 --weights yolov5n.pt --cfg model/yolov5n.yaml  --batch-size 128
                                                                     yolov5s.pt       model/yolov5s.yaml               64
                                                                     yolov5m.pt       model/yolov5m.yaml               40
                                                                     yolov5l.pt       model/yolov5l.yaml               24
                                                                     yolov5x.pt       model/yolov5x.yaml               16

官方提供的目标检测预训练权重如下。

Model	size ^(pixels)	mAP^val 50-95	mAP^val 50	Speed ^{CPU b1 (ms)}	Speed ^{V100 b1 (ms)}	Speed ^{V100 b32 (ms)}	params ^(M)	FLOPs ^{@640 (B)}
YOLOv5n	640	28.0	45.7	45	6.3	0.6	1.9	4.5
YOLOv5s	640	37.4	56.8	98	6.4	0.9	7.2	16.5
YOLOv5m	640	45.4	64.1	224	8.2	1.7	21.2	49.0
YOLOv5l	640	49.0	67.3	430	10.1	2.7	46.5	109.1
YOLOv5x	640	50.7	68.9	766	12.1	4.8	86.7	205.7

YOLOv5n6	1280	36.0	54.4	153	8.1	2.1	3.2	4.6
YOLOv5m6	1280	51.3	69.3	887	11.1	6.8	35.7	50.0
YOLOv5l6	1280	53.7	71.3	1784	15.8	10.5	76.8	111.4
YOLOv5x6 + [TTA]	1280 1536	55.0 55.8	72.7 72.7	3136 -	26.2 -	19.4 -	140.7 -	209.8 -

（2）YOLOv6的训练方法

在终端输入如下命令，进入 yolov6 文件夹。
```
cd yolov6
```
将转换后的数据集放在 yolov6 的根目录下。

在 YoloDataSets 目录下添加 .yaml 配置文件 data.yaml ，内容和格式如下。

train: YoloDataSets/images/train       # train images
val: YoloDataSets/images/val           # val images
test: YoloDataSets/images/test
is_coco: False

# number of classes
nc: 2

# class names
names: ['dog','man']

在终端运行如下命令，参数按实际情况进行调整。

python tools/train.py --batch 64 --conf configs/yolov6s6_finetune.py --data YoloDataSets/data.yaml --epochs 300  --device 0

官方提供的目标检测预训练权重如下。

Model	Size	mAP^val 0.5:0.95	Speed^{T4 trt fp16 b1 (fps)}	Speed^{T4 trt fp16 b32 (fps)}	Params ^(M)	FLOPs ^(G)
YOLOv6-N	640	37.5	779	1187	4.7	11.4
YOLOv6-S	640	45.0	339	484	18.5	45.3
YOLOv6-M	640	50.0	175	226	34.9	85.8
YOLOv6-L	640	52.8	98	116	59.6	150.7

YOLOv6-N6	1280	44.9	228	281	10.4	49.8
YOLOv6-S6	1280	50.3	98	108	41.4	198.0
YOLOv6-M6	1280	55.2	47	55	79.6	379.5
YOLOv6-L6	1280	57.2	26	29	140.4	673.4

（3）YOLOv7的训练方法

在终端输入如下命令，进入 yolov7 文件夹。
```
cd yolov7
```
将转换后的数据集放在 yolov7 的根目录下。

在 YoloDataSets 目录下添加 .yaml 配置文件 data.yaml ，内容和格式如下。

train: YoloDataSets/train.txt
val: YoloDataSets/val.txt
test: YoloDataSets/test.txt

# number of classes
nc: 2

# class names
names: ['dog','man']

在终端运行如下命令，参数按实际情况进行调整。

# finetune p5 models
python train.py --workers 8 --device 0 --batch-size 32 --data YoloDataSets/data.yaml --img 640 640 --cfg cfg/training/yolov7-custom.yaml --weights 'yolov7_training.pt' --name yolov7-custom --hyp data/hyp.scratch.custom.yaml

# finetune p6 models
python train_aux.py --workers 8 --device 0 --batch-size 16 --data YoloDataSets/data.yaml --img 1280 1280 --cfg cfg/training/yolov7-w6-custom.yaml --weights 'yolov7-w6_training.pt' --name yolov7-w6-custom --hyp data/hyp.scratch.custom.yaml

官方提供的目标检测预训练权重如下。

Model	Test Size	AP^test	AP₅₀^test	AP₇₅^test	batch 1 fps	batch 32 average time
YOLOv7	640	51.4%	69.7%	55.9%	161fps	2.8ms
YOLOv7-X	640	53.1%	71.2%	57.8%	114fps	4.3ms

YOLOv7-W6	1280	54.9%	72.6%	60.1%	84fps	7.6ms
YOLOv7-E6	1280	56.0%	73.5%	61.2%	56fps	12.3ms
YOLOv7-D6	1280	56.6%	74.0%	61.8%	44fps	15.0ms
YOLOv7-E6E	1280	56.8%	74.4%	62.1%	36fps	18.7ms

（4）YOLOv8的训练方法

在终端输入如下命令，进入 yolov8 文件夹。
```
cd yolov8
```
将转换后的数据集放在 yolov8 的根目录下。

在 YoloDataSets 目录下添加 .yaml 配置文件 data.yaml ，内容和格式如下。

path : ../YoloDataSets
train: train.txt
val: val.txt
test: test.txt

# number of classes
nc: 2

# class names
names: ['dog','man']

在终端运行如下命令，参数按实际情况进行调整。

yolo task=detect mode=train model=yolov8n.yaml data=YoloDataSets/data.yaml batch=28 epochs=300 imgsz=640 workers=32 device=0
                                  yolov8s.yaml
                                  yolov8m.yaml
                                  yolov8l.yaml
                                  yolov8x.yaml

官方提供的目标检测预训练权重如下。

Model	size ^(pixels)	mAP^val 50-95	Speed ^{CPU ONNX (ms)}	Speed ^{A100 TensorRT (ms)}	params ^(M)	FLOPs ^(B)
YOLOv8n	640	37.3	80.4	0.99	3.2	8.7
YOLOv8s	640	44.9	128.4	1.20	11.2	28.6
YOLOv8m	640	50.2	234.7	1.83	25.9	78.9
YOLOv8l	640	52.9	375.2	2.39	43.7	165.2
YOLOv8x	640	53.9	479.1	3.53	68.2	257.8