准备YOLO训练数据:数据标注技术和最佳实践

点击下方卡片,关注“小白玩转Python”公众号

如果你已经对YOLO目标检测算法有了基本的了解,并且可能迫不及待地想在你的项目中尝试它。成功的关键是一个定制的训练数据集。

量身定制的数据集对于开发高精度、高效的YOLO模型至关重要,这些模型满足你的特定用例需求。通过标注你自己的数据,你确保模型学习识别与你领域相关的对象,无论是在道路上检测车辆、识别传送带上的产品,还是在建筑工地上发现安全隐患。

3accc879e824e8ab8849b14725e40158.jpeg

在这篇文章中,我们将指导你如何准备用于训练YOLO模型的标注数据,从在图像中标记对象到组织你的数据集。

YOLO 训练的数据准备

记住,一个准备充分的标注数据集不仅提高了模型的性能,还减少了训练所需的时间和资源。数据准备过程可以分为四个步骤:

  • 数据收集:收集一个大型、多样化的图像数据集,代表你希望模型检测的所有类别。你可以使用像COCO和Pascal VOC这样的公共数据集,或者收集你自己的定制数据。

  • 数据标注:每张图像都需要YOLO格式的标注,包括每个对象的类别和位置(通常是边界框)。标注的准确性直接影响模型性能。

  • 标注格式转换:YOLO需要特定格式的标注。每张图像都有一个.txt文件,列出所有对象及其类别和边界框信息。边界框的格式如下:

<object-class> <x_center> <y_center> <width> <height>

坐标是相对于图像尺寸归一化的。<object-class> 是类别索引。

  • 数据集分割:将数据集分割为训练集、验证集和测试集。这对于避免过拟合并评估模型性能至关重要。典型的分割比例是70%训练,15%验证,15%测试。

YOLO 的数据标注

现在,让我们逐步了解数据标注过程,为YOLO训练准备数据集。首先,选择一个标注工具。开源和基于云的工具都可以工作,但在线版本对于团队来说往往更高效。我们将以BasicAI Cloud为例,这是目标检测研究的流行选择。无需安装;只需在https://app.basic.ai. 注册一个免费账户即可。

913417453bdca9e0d4a7bf9fe670c504.png

我们已经收集了一个用于海龟检测的数据集。没有标注,模型无法学习,所以让我们开始标注。

上传数据

在BasicAI Cloud UI上,转到“Datasets,点击“+Create”,选择“Image”类型,命名你的数据集,然后点击“Create”

287fc892ce9339487fa1bba9b1a0f2e3.jpeg

在预览界面中,点击蓝色“+Upload”按钮。你可以通过本地文件、URL或云存储上传。这里,我们从本地地址上传。

9ec4fbf37daf617572d91fcfe7aa5a41.jpeg

创建本体

让我们创建一个“Turtle”本体类别。转到“Ontology”标签页,点击“+Create”。选择边界框类型,命名它,并设置框颜色。

8ad73bd7d1272897568094fbef16c458.jpeg

标注数据

回到“Data”标签页,选择所有数据,然后点击“Annotate”

a7031235d3d8a650c509042ea69d68de.jpeg

标注工具在左侧,类别在右侧。

fb214045dc5a6f776178d4e157b02a8a.jpeg

选择“Bounding Box Tool”(快捷键‘1’)。光标变成十字准线。

提示:预先选择类别,以便自动将其分配给新框。非常适合多目标检测。

点击对象的一个角,然后点击对角,创建一个框。使用箭头工具调整边缘。详情可以参考:

https://video.wixstatic.com/video/4b3c31_95a85dde75de4bbf83e616098f9b73b1/720p/mp4/file.mp4

提示:“Display setting”中启用“Measure Line”以获得辅助线。

使用这种方法在所有图像中标注对象。完成后点击“Save”并退出。

“Preview Annotateions”显示结果。

9e3f09306309e07f4dcfbb2da48027bb.jpeg

导出数据点击Export”以创建导出任务。

2f74a7a5ed3b6a52d1fcfc2c0bc91ada.jpeg

“Annotation Format”下,选择YOLO的TXT格式。点击“Create”

准备好后下载结果。

1dc511352420b61a49ebf30a5d5ac5af.jpeg

每个文件都包含训练所需的信息。在这里,系统自动将“0”分配给单个标签。

项目结构像YOLO v7一样组织项目,因为其结构与v9非常相似。

37623822b68eb89419cc58e440460289.png

为什么选择BasicAI Cloud进行YOLO数据标注?BasicAI Cloud是一个全面的智能数据标注解决方案,它与你的YOLO工作流程无缝集成,使标注过程高效且协作。

  • 全面功能:BasicAI Cloud支持所有数据类型,包括图像、视频、激光雷达融合、音频和文本。模型辅助工具支持自动预标注(实例标注、语义分割、语音识别)和交互式标注。

  • 为团队协作而建:可扩展的项目管理,将外部团队和模型集成到自定义工作流程中。快速批量分配标注任务。自定义实时QA快速捕捉质量问题。提供了详细的绩效报告。

  • 数据集管理:上传预标注数据进行微调。视频帧提取和连续帧分割/合并。云存储集成。

  • 成本:免费账户几乎具有全部功能——5个座位,200GB存储,10,000个免费自动标签。

它们非常适合小型研究团队,并且对于大型团队来说价格具有竞争力。提供企业级本地部署。通过利用BasicAI Cloud满足你的YOLO数据标注需求,你可以简化准备高质量标注数据的过程,与你的团队有效协作,并轻松管理你的数据集。这个强大的平台使你能够专注于开发准确高效的YOLO目标检测模型,同时最小化花在数据标注上的时间和精力。

·  END  ·

🌟 想要变身计算机视觉小能手?快来「小白玩转Python」公众号!

回复Python视觉实战项目,解锁31个超有趣的视觉项目大礼包!🎁

5c68646fe6e3caa4a784ea271b856c96.png

本文仅供学习交流使用,如有侵权请联系作者删除

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值