win10使用 yolov5 第二弹!如何成功训练自己的数据集!(roboflow、W&B、labelImg)

刚开始学习使用yolov5的朋友,除了完成我上一篇博文cuda\anaconda\pytorch等环境搭建以外,我们的第一步还没有结束。
这篇博文将继续带着大家逐步探索学习yolov5的历程!

参照官方给出的训练数据集的教程:官方教程
(由于是全英文的,还有许多跳转,部分同学可能看起来比较费劲,我自己也看了好久才理清楚的,所以这里出一个中文版教程,帮助理解)

创建环境:
由于我上一篇博客中python安装的版本是3.9,在prompt中,

conda activate yolov5 //激活环境,每次都要激活

你可以去github上下载yolov5项目https://github.com/ultralytics/yolov5,这是经过大数据训练的成熟模型,我们需要完成的项目只需要在这个基础上进行改进就可以了。

安装pycharm,直接去pycharm官网下载,一路默认安装就好了。

============================================================================
接下来,将带着大家一起开始第一个数据集训练!

创建自定义模型来检测您的对象是一个迭代过程,包括收集和组织图像、标记您感兴趣的对象、训练模型、将其部署到野外进行预测,然后使用该部署的模型收集边缘案例的示例以重复和改进。

创建数据集

YOLOv5 模型必须在标记数据上进行训练,才能学习该数据中的对象类别。在开始训练之前创建数据集有两种选择:
1、roboflow: 一种网页版的图形编辑工具,能够以 YOLOv5 的注释格式导出它们。

如果你是第一次用这个网页,会有引导,记住顺序,一步步标记好自己的数据集。

我这里简单写一个教程:

创建新项目—》
在这里插入图片描述
将图片拖到这个框里面,点击右上角上传
在这里插入图片描述
点击右边,开始对图片进行标记
在这里插入图片描述
像这样逐个标记好,注意:一张图必须一次性标记好,如果想单独吧梨标记好了再回来标记苹果,你会发现,已经没有勾选框了,你根本就无法再标记了。
在这里插入图片描述
点击右上角,add XX picture to dataset,出现选择框,要选择将其中多少作为训练集,那些作为测试集,那些作为验证集。这个按照自己的需要选择。弄好之后,点击add picture

双击进入刚才标记的图片集,把这几个都选好,generate
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
将这一串代码复制下来,便于到时候调出刚才标记的数据集。
到这里数据集的标记工作就已经完成了,但我们经常需要用到的数据集可能是成千上万张图片,所以这个过程是极其费时间的。网上有许多别人已经标记好的数据集。在这里列举几个,有需要的可以去看看。
用于图像识别的数以百万计的图像:
ImageNet:“http://www.image-net.org”; Place: " http://places.csail.mit.edu/downloadData.html"
用于语音识别的上千小时的数据集:
http://www.openslr.org/resources.php

2、安装labelimg图形处理软件

在这里插入图片描述
每次在下面这个路径下输入python labelImg.py就能打开了(记住路径)
在这里插入图片描述
操作起来也不困难。
可视化的界面最终直接把图片存在文件夹里,比roboflow可视化强很多。

这个软件也是用来标记数据集的,和roboflow二选一即可.

必须要做的!

安装wandb环境: 进入虚拟环境,键入pip install wandb

weight&biases官网上注册自己的账号,因为后面在ptycharm中运行代码时,会自动从这个网站上下载.pt模型的权重文件,到时候会需要 API 码。

如果不知道自己API码,虚拟环境下,键入wandb init

训练自己的数据集

其实,我们从github上下载的代码就是直接可以运行的,里面有两张命名如下的图片,打开detect.py程序,右键,run ,就能看到结果。结果保存在runs–>detect–>exp中
在这里插入图片描述

如果要训练自己的数据集该怎么做呢?
首先将划分好的数据集分为训练集+验证集合+测试集合.;利用labelimg工具完成数据集的划分,记住yolov5数据集需要.txt文件,里面包含目标框中心点 长宽信息。(有的目标检测算法包含图片本身大小这些辅助信息),如果不是,可用python代码进行格式转换。
直接将划分好的数据集,替换yolo_master中的coco2018数据集就行。

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
YOLOv5是一种广泛使用的目标检测模型,可以用于检测图像中的多个目标。为了使用YOLOv5训练和检测VOC格式的数据集,需要进行以下步骤: 1. 数据集准备:首先,将VOC格式的数据集准备好。VOC格式通常包含图像和相应的XML注释文件,包含了目标的位置和类别等信息。 2. 数据集转换:YOLOv5期望数据集以特定的格式进行训练。可以使用YOLOv5提供的脚本将VOC格式的数据集转换为YOLOv5所需的格式(YAML和txt文件)。 3. 创建YAML文件:创建一个YAML文件,用于定义模型的配置和参数。该文件包括了模型的架构、超参数设置、数据集路径等信息。 4. 数据集划分:将数据集划分为训练集和验证集。通常可以将大约80%的数据用作训练集,剩余的20%用作验证集。 5. 模型训练使用YOLOv5提供的train.py脚本开始训练模型。在终端中执行train.py命令,并传递YAML文件的路径。 6. 模型评估:训练完成后,可以使用YOLOv5提供的test.py脚本对训练好的模型进行评估。该脚本会计算模型的性能指标,如平均精度(mean average precision)。 7. 目标检测:使用YOLOv5提供的detect.py脚本对新的图像进行目标检测。在终端中执行detect.py命令,并指定已经训练好的模型的路径和需要检测的图像路径。 通过以上步骤,就可以使用YOLOv5训练和检测VOC格式的数据集了。要注意的是,YOLOv5还提供了其他功能和选项,可以根据具体需求进行调整和使用

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值