【YOLO】怎么去收集制作自己需要的数据集？（持续更新）

最新推荐文章于 2025-03-14 15:11:37 发布

steamedobun

最新推荐文章于 2025-03-14 15:11:37 发布

阅读量1.4k

点赞数 22

CC 4.0 BY-SA版权

分类专栏：计算机视觉 YOLO 文章标签： YOLO 计算机视觉目标检测机器学习图像处理视觉检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/steamedobun/article/details/141640321

YOLO 同时被 2 个专栏收录

7 篇文章

订阅专栏

计算机视觉

6 篇文章

订阅专栏

不同数据集类型（VOC、COCO、YOLO）

开篇先介绍几种常见的数据集格式和各种文件应该放第几层目录

在目标检测任务中，常见的数据集格式有三种，分别为voc(xml)、coco(json)、yolo(txt)

YOLO有些模型支持多种，有些只支持其中一到两种

请先参考下述博客有初步了解

目标检测任务中常用的数据集格式(voc、coco、yolo)_voc数据集格式-CSDN博客

如何收集数据集？

Roboflow网站

这个是Ultralytics官方(YOLOv8)推荐的开源数据集，可以导出成不同格式的数据集（适用于不同的模型），有一点弊端（网站加载较慢，需要登陆Sign in）

YOLOv8网址(可找到)：ultralytics/ultralytics: NEW - YOLOv8 🚀 in PyTorch > ONNX > OpenVINO > CoreML > TFLite (github.com)

官方网址：Roboflow: Computer vision tools for developers and enterprises

爬虫爬取图片

亲测可行的部分代码博客

python 爬虫获取图片(一):简单爬取_python爬虫爬取图片-CSDN博客

Python 爬虫批量爬取网页图片保存到本地_爬虫爬取图片保存到本地-CSDN博客

如何制作数据集？

Labelimg

labelimg是一款开源的图像标注工具，标签可用于分类和目标检测，它是用python写的，并使用Qt作为其图形界面，简单好用

1.安装

在cmd输入以下命令（使用清华源加速）

pip install labelimg -i https://pypi.tuna.tsinghua.edu.cn/simple

2.使用

安装结束后，在cmd中输入labelimg打开，具体使用方法请参考下述博客

LabelImg（目标检测标注工具）的安装与使用教程-CSDN博客

X-Anylabeling

这里介绍一个很好用的标注工具（可以减轻大部分标注时间，当然前提是你需要有一份已经训练好的模型.onnx格式）X-Anylabeling: 新一代自动标注工具

简单说明原理：通过训练好的模型识别检测新的图片并自动标注（打标签），我们只需要人工审核一下有没有漏打的标签（所以对于数据集较大的可以抽取一部分出来先训练个精度一般的模型，再使用该工具将剩余数据集标注好）

有两种安装方法：

1.源码

源码地址如下：

https://github.com/CVHub520/X-AnyLabeling

根据自己电脑需求安装所需的环境依赖requirements.txt

pip install -r requirements.txt

安装出现报错，需科学上网解决

打开软件

python anylabeling/app.py

2.exe文件安装

安装包链接如下，

Release X-AnyLabeling v2.3.0 · CVHub520/X-AnyLabeling (github.com)

安装自己需要的版本.exe文件

具体使用方法参考

自动标注！！！x-anylabeling使用教程-CSDN博客

持续更新，敬请期待！！！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。