用MATLAB如何制作自己的数据集,Windows10+YOLOv3实现检测自己的数据集(1)——制作自己的数据集...

一、数据标注

在深度学习的目标检测任务中,首先要使用训练集进行模型训练。训练的数据集好坏决定了任务的上限。下面介绍两种常用的图像目标检测标注工具:Labelme和LabelImg。

(1)Labelme

Labelme适用于图像分割任务和目标检测任务的数据集制作,它来自该项目:https://github.com/wkentaro/labelme 。

按照项目中的教程安装完毕后,应用界面如下图所示:

e8486f70ff1ad269943af850372c2f66.png

它能够提供多边形、矩形、圆形、直线和点的图像标注,并将结果保存为 JSON 文件。

(2)LabelImg

应用界面如下图所示:

f533ca8806c2dad6afb6bec77d304638.png

它能够提供矩形的图像标注,并将结果保存为txt(YOLO)或xml(PascalVOC)格式。如果需要修改标签的类别内容,则在主目录data文件夹中的predefined_classes.txt文件中修改。

我使用的就是这一个标注软件,标注结果保存为xml格式,后续还需要进行标注格式的转换。

操作快捷键:

Ctrl + u  加载目录中的所有图像,鼠标点击Open dir同功能

Ctrl + r  更改默认注释目标目录(xml文件保存的地址)

Ctrl + s  保存

Ctrl + d  复制当前标签和矩形框

space     将当前图像标记为已验证

w         创建一个矩形框

d         下一张图片

a         上一张图片

del       删除选定的矩形框

Ctrl++    放大

Ctrl--    缩小

↑→↓←        键盘箭头移动选定的矩形框

二、数据扩增

在某些场景下的目标检测中,样本数量较小,导致检测的效果比较差,这时就需要进行数据扩增。本文介绍常用的6类数据扩增方式,包括裁剪、平移、改变亮度、加入噪声、旋转角度以及镜像。

三、将数据转换至COCO的json格式

首先让我们明确一下几种格式,参考自【点此处】:

3.1 csv

csv/

labels.csv

images/

image1.jpg

image2.jpg

...

labels.csv 的形式:

/path/to/image,xmin,ymin,xmax,ymax,label

例如:

/mfs/dataset/face/image1.jpg,450,154,754,341,face

/mfs/dataset/face/image2.jpg,143,154,344,341,face

3.2 voc

标准的voc数据格式如下:

VOC2007/

Annotations/

0d4c5e4f-fc3c-4d5a-906c-105.xml

0ddfc5aea-fcdac-421-92dad-144/xml

...

ImageSets/

Main/

train.txt

test.txt

val.txt

trainval.txt

JPEGImages/

0d4c5e4f-fc3c-4d5a-906c-105.jpg

0ddfc5aea-fcdac-421-92dad-144.jpg

...

3.3 COCO

coco/

annotations/

instances_train2017.json

instances_val2017.json

images/

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值