智星云从零开始手把手教你训练yolov5

智星云算力

已于 2022-07-21 11:22:12 修改

阅读量575

点赞数

文章标签：计算机视觉深度学习人工智能

于 2022-07-21 11:21:30 首次发布

原文链接：https://zhuanlan.zhihu.com/p/544330911

版权

网络结构

在这里插入图片描述

Yolov5的网络结构图，可以看出，还是分为输入端、Backbone、Neck、Prediction四个部分

输入端

Mosaic数据增强

Yolov5的输入端采用了和Yolov4一样的Mosaic数据增强的方式。

自适应锚框计算

在Yolo算法中，针对不同的数据集，都会有初始设定长宽的锚框。在网络训练中，网络在初始锚框的基础上输出预测框，进而和真实框groundtruth进行比对，计算两者差距，再反向更新，迭代网络参数。

自适应图片缩放

Yolov5的代码中对原始图像自适应的添加最少的黑边

Backbone

Focus结构

在这里插入图片描述

CSP结构

在这里插入图片描述

Neck

Prediction

Bounding box损失函数

Yolov5中采用其中的GIOU_Loss做Bounding box的损失函数

nms非极大值抑制

Yolov5中采用普通的nms的方式

训练自定义数据

创建Dataset.yaml

这里官方的例子使用的是coco128.yaml，这是一个小型教程数据集，由COCO train2017 中的前128张图像组成。在此示例中，这些相同的128张图像用于训练和验证。coco128.yaml定义1）训练图像目录的路径（或带有训练图像列表的* .txt文件的路径），2）与我们的验证图像相同的路径，3）类数，4）类名称：

＃train和Val的数据集（图像目录或* .txt与图像路径文件）
train： …/coco128/images/train2017/
val： …/coco128/images/train2017/
＃number of classes
nc： 80
＃Classes
名称： [‘person’, ‘bicycle’, ‘car’, ‘motorcycle’, ‘airplane’, ‘bus’, ‘train’, ‘truck’, ‘boat’, ‘traffic light’,
‘fire hydrant’, ‘stop sign’, ‘parking meter’, ‘bench’, ‘bird’, ‘cat’, ‘dog’, ‘horse’, ‘sheep’, ‘cow’,
‘elephant’, ‘bear’, ‘zebra’, ‘giraffe’, ‘backpack’, ‘umbrella’, ‘handbag’, ‘tie’, ‘suitcase’, ‘frisbee’,
‘skis’, ‘snowboard’, ‘sports ball’, ‘kite’, ‘baseball bat’, ‘baseball glove’, ‘skateboard’, ‘surfboard’,
‘tennis racket’, ‘bottle’, ‘wine glass’, ‘cup’, ‘fork’, ‘knife’, ‘spoon’, ‘bowl’, ‘banana’, ‘apple’,
‘sandwich’, ‘orange’, ‘broccoli’, ‘carrot’, ‘hot dog’, ‘pizza’, ‘donut’, ‘cake’, ‘chair’, ‘couch’,
‘potted plant’, ‘bed’, ‘dining table’, ‘toilet’, ‘tv’, ‘laptop’, ‘mouse’, ‘remote’, ‘keyboard’, ‘cell phone’,
‘microwave’, ‘oven’, ‘toaster’, ‘sink’, ‘refrigerator’, ‘book’, ‘clock’, ‘vase’, ‘scissors’, ‘teddy bear’,
‘hair drier’, ‘toothbrush’]

如果使用自己建立的数据集要修改的参数有

train：换成你自己的训练集地址
val：换成自己的val地址
nc: 换成你自己定义的类别的数量
类名称：换成自己定义的类别的名称

创建标签

每张图像一个txt文件(如果图像中没有对象，则不需要×.txt文件)。txt文件内容有：
每个对象一行
每行都是class x_center y_center width height格式
框坐标必须采用归一化的xywh格式（从0到1）。如果boxes以像素为单位，划分x_center和width关于图像宽度，y_center和height关于图像高度。
类别定义利用序号，一般从0开始。

每个图像的标签文件应该可以通过在其路径名中简单地替换/images/.jpg为/labels/.txt来定位。
例如

data/images/train2017/000000109622.jpg ＃image
data/labels/train2017/000000109622.txt ＃label

例如：
0 0.55 0.51 0.12 0.37
0 0.38 0.41 0.06 0.10
0 0.31 0.40 0.08 0.10
0 0.24 0.41 0.02 0.04
表示：4个人（所属类别定义为0）的标签文件

组织目录

data/coco128放在/yolov5项目的旁边，data/coco128下包含两个文件夹。
一个为/coco128/images，另一个为/coco128/labels，里面分别存放数据集图片和数据集标注信息。

选择模型

yolov5提供了五个模型，这里我们以yolov5s.yaml为例子，双击打开，更新其中参数适应之前定义的类别。这里一般不用动更新nc就可以了。就是匹配你自己数据集的类别就可以了，其他的参数一般不做优化不需要动。

训练

python train.py --img 640 --batch 16 --epochs 5 --data ./data/coco128.yaml --cfg ./models/yolov5s.yaml --weights yolov5s.pt

测试

python detect.py --weights yolov5s.pt --img 640 --conf 0.25 --source data/images

使用智星云快速体验yolov5训练

etect.py --weights yolov5s.pt --img 640 --conf 0.25 --source data/images


# 使用智星云快速体验yolov5训练
智星云提供可完整复现yolov5训练和测试的jupyter notebook脚本，数据集和权重以及代码都可在国内快速下载。点击下面链接快速体验。

智星云算力

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
智星云从零开始手把手教你训练yolov5

这里官方的例子使用的是coco128.yaml，这是一个小型教程数据集，由COCOtrain2017中的前128张图像组成。在此示例中，这些相同的128张图像用于训练和验证。coco128.yaml定义1）训练图像目录的路径（或带有训练图像列表的*.txt文件的路径），2）与我们的验证图像相同的路径，3）类数，4）类名称＃train和Val的数据集（图像目录或*.txt与图像路径文件）trainvalnc80＃Classes名称。......
复制链接

扫一扫