目标检测数据集VOC 2007/2012 整理

做目标检测时我们经常用到voc 2007, voc 2012 数据集,今天就来整理一下。

数据集的下载地址: https://pjreddie.com/projects/pascal-voc-dataset-mirror/

 

voc 2007

数据集包含 训练集:5011 张,测试集:4952张,共9963张,20个类

20个类分别为:

aeroplane
bicycle
bird
boat
bottle
bus
car
cat
chair
cow
diningtable
dog
horse
motorbike
person
pottedplant
sheep
sofa
train
tvmonitor 

VOC2007 ,我们解压训练集后看到的文件目录:

 

目录的结构如下:

├── Annotations            # 里面存放 .xml 文件,图片的标签,比如坐标位置信息等。
├── ImageSets             # 这个目录下有三个文件夹,文件夹存放的都是 .txt 文件,类别标签
│   ├── Layout
│   ├── Main                 # Main 目录下
│   └── Segmentation
├── JPEGImages               # 图像文件 .jpg 格式
├── labels
├── SegmentationClass     # 存放的是图片文件,分割后的图片
└── SegmentationObject    # 存放的是图片文件,分割后的图片

Annotations:存放 xml格式文件,每一个xml文件名对应JPEGImages 中的一张图片。xml文件里是对图片的解释,想了解可以自己看。

ImageSets:里面有三个文件夹Layout,Main,Segmentation

  1. layout:存放的是人体部位的数据
  2. Main:存放物体识别的分类数据,里面有 xx_train.txt, xx_test.txt , xx_trainval.txt, xx_val.txt 文件,xx表示分类,总共20类。
  3. Segmentation:存放可用于分割的数据

我们做目标检测,只需要关注Main文件夹即可。

 

voc 2012

下载地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar

voc 2012 数据集是voc 2007的升级版,一共11530张图片,数据集分为20类(包含背景21)。

人:人

动物:鸟、猫、牛、狗、马、羊

车辆:飞机、自行车、船、巴士、汽车、摩托车、火车

室内:瓶、椅子、餐桌、盆栽植物、沙发、电视/监视器

 

voc2012 数据集和2007结构是一样的,文件夹存放的东西也类似:

├── Annotations             # .xml 文件,文件里面是对图片的解释
├── ImageSets               # 里面包含四个文件,文件夹下面存放 .txt文件
│   ├── Action 
│   ├── Layout
│   ├── Main
│   └── Segmentation
├── JPEGImages               # 原图片
├── labels
├── SegmentationClass     # 分割后的图片
└── SegmentationObject    # 分割后的图片

 

ImageSets 目录下:

  1. Action:存放的是人的动作(例如running、jumping等等,这也是VOC challenge的一部分)
  2. Layout:存放的是具有人体部位的数据(人的head、hand、feet等等,这也是VOC challenge的一部分)
  3. Main:存放的是图像物体识别的数据,总共分为20类
  4. Segmentation:存放的是可用于分割的数据

参考:

https://blog.csdn.net/qq_41185868/article/details/79927556

https://blog.csdn.net/weixin_42142612/article/details/83142213

 

 

 

 

 

  • 8
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
CQT目标检测数据集标注是指在CQT数据集中标记出目标物体的位置和边界框,以用于训练和测试目标检测算法。目标检测是计算机视觉领域的一项重要任务,旨在通过识别和定位图像中的目标物体,实现图像理解和分析。 CQT目标检测数据集标注的过程一般分为以下几个步骤: 1. 数据收集:收集一系列包含目标物体的图片作为数据集。图片可以从各种途径获取,如网络下载、相机拍摄等。 2. 标注工具准备:选择合适的图像标注工具,例如LabelImg,用于标注目标物体的位置和边界框。该工具可以在图像上手动绘制矩形框来标记目标物体。 3. 标注实施:根据图片中目标物体的位置和边界,逐一对图片进行标注。使用标注工具选择目标物体,点击鼠标拖拽绘制矩形框,框选目标物体,并保存标注信息。 4. 数据验证:标注完成后,需要对标注数据进行验证。可以通过检查图像和标注框之间的对应关系,或者使用其他评估指标来确保标注质量。 5. 数据整理:将标注好的数据和对应的标签信息整理成特定格式,方便后续训练目标检测算法时使用。常见的格式包括Pascal VOC、COCO等。 CQT目标检测数据集标注的准确性和质量对于训练和测试目标检测算法的效果至关重要。因此,在标注过程中需细致认真、准确无误,并对标注数据进行多次验证与整理,以保证数据集的高质量和可用性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

liguiyuan112

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值