【YOLO】怎么去收集制作自己需要的数据集?(持续更新)

不同数据集类型(VOC、COCO、YOLO)

开篇先介绍几种常见的数据集格式和各种文件应该放第几层目录

目标检测任务中,常见的数据集格式有三种,分别为voc(xml)、coco(json)、yolo(txt)

YOLO有些模型支持多种,有些只支持其中一到两种

请先参考下述博客有初步了解

目标检测任务中常用的数据集格式(voc、coco、yolo)_voc数据集格式-CSDN博客

如何收集数据集?

Roboflow网站

这个是Ultralytics官方(YOLOv8)推荐的开源数据集,可以导出成不同格式的数据集(适用于不同的模型),有一点弊端(网站加载较慢,需要登陆Sign in)

YOLOv8网址(可找到):ultralytics/ultralytics: NEW - YOLOv8 🚀 in PyTorch > ONNX > OpenVINO > CoreML > TFLite (github.com)

官方网址:Roboflow: Computer vision tools for developers and enterprises

爬虫爬取图片

亲测可行的部分代码博客

python 爬虫获取图片(一):简单爬取_python爬虫爬取图片-CSDN博客

Python 爬虫批量爬取网页图片保存到本地_爬虫爬取图片保存到本地-CSDN博客

如何制作数据集?

Labelimg

 labelimg是一款开源的图像标注工具,标签可用于分类和目标检测,它是用python写的,并使用Qt作为其图形界面,简单好用

1.安装

cmd输入以下命令(使用清华源加速)

pip install labelimg -i https://pypi.tuna.tsinghua.edu.cn/simple
2.使用

安装结束后,在cmd中输入labelimg打开,具体使用方法请参考下述博客

LabelImg(目标检测标注工具)的安装与使用教程-CSDN博客

X-Anylabeling

这里介绍一个很好用的标注工具(可以减轻大部分标注时间,当然前提是你需要有一份已经训练好的模型.onnx格式)X-Anylabeling: 新一代自动标注工具

简单说明原理通过训练好的模型识别检测新的图片并自动标注(打标签),我们只需要人工审核一下有没有漏打的标签(所以对于数据集较大的可以抽取一部分出来先训练个精度一般的模型,再使用该工具将剩余数据集标注好)

有两种安装方法:

1.源码

源码地址如下:

https://github.com/CVHub520/X-AnyLabeling

根据自己电脑需求安装所需的环境依赖requirements.txt

pip install -r requirements.txt

安装出现报错,需科学上网解决

打开软件

python anylabeling/app.py
2.exe文件安装

安装包链接如下,

Release X-AnyLabeling v2.3.0 · CVHub520/X-AnyLabeling (github.com)

安装自己需要的版本.exe文件

具体使用方法参考

自动标注!!!x-anylabeling使用教程-CSDN博客

持续更新,敬请期待!!!

  • 17
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值