不同数据集类型(VOC、COCO、YOLO)
开篇先介绍几种常见的数据集格式和各种文件应该放第几层目录
在目标检测任务中,常见的数据集格式有三种,分别为voc(xml)、coco(json)、yolo(txt)
YOLO有些模型支持多种,有些只支持其中一到两种
请先参考下述博客有初步了解
如何收集数据集?
Roboflow网站
这个是Ultralytics官方(YOLOv8)推荐的开源数据集,可以导出成不同格式的数据集(适用于不同的模型),有一点弊端(网站加载较慢,需要登陆Sign in)
YOLOv8网址(可找到):ultralytics/ultralytics: NEW - YOLOv8 🚀 in PyTorch > ONNX > OpenVINO > CoreML > TFLite (github.com)
官方网址:Roboflow: Computer vision tools for developers and enterprises
爬虫爬取图片
亲测可行的部分代码博客
如何制作数据集?
Labelimg
labelimg是一款开源的图像标注工具,标签可用于分类和目标检测,它是用python写的,并使用Qt作为其图形界面,简单好用
1.安装
在cmd输入以下命令(使用清华源加速)
pip install labelimg -i https://pypi.tuna.tsinghua.edu.cn/simple
2.使用
安装结束后,在cmd中输入labelimg打开,具体使用方法请参考下述博客
X-Anylabeling
这里介绍一个很好用的标注工具(可以减轻大部分标注时间,当然前提是你需要有一份已经训练好的模型.onnx格式)X-Anylabeling: 新一代自动标注工具
简单说明原理:通过训练好的模型识别检测新的图片并自动标注(打标签),我们只需要人工审核一下有没有漏打的标签(所以对于数据集较大的可以抽取一部分出来先训练个精度一般的模型,再使用该工具将剩余数据集标注好)
有两种安装方法:
1.源码
源码地址如下:
根据自己电脑需求安装所需的环境依赖requirements.txt
pip install -r requirements.txt
安装出现报错,需科学上网解决
打开软件
python anylabeling/app.py
2.exe文件安装
安装包链接如下,
Release X-AnyLabeling v2.3.0 · CVHub520/X-AnyLabeling (github.com)
安装自己需要的版本.exe文件
具体使用方法参考