【目标检测数据集】VOC2007 数据集介绍

一、介绍

VOC 数据是 PASCAL VOC Challenge 用到的数据集,官网:http://host.robots.ox.ac.uk/pascal/VOC/

备注:VOC数据集常用的均值为:mean_RGB=(122.67891434, 116.66876762, 104.00698793)

Pytorch 上通用的数据集的归一化指标为:mean=(0.485, 0.456, 0.406) , std=(0.229, 0.224, 0.225)

voc2007 官网:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/index.html

注意:在 VOC 官方给出的数据集中,只有 VOC2007 是给出了带有标记的测试集的。其他年份的数据集是没有给测试集,只给的有带标记的验证集。

二、VOCdevikit

里面是开发工具包代码和文档。解压后如下:

如图所示,里面是一些 MATLAB 代码,就是用这些代码处理的这个数据集,具体可以看看 devkit_doc.pdf, 就是一个比较详细的说明书。

三、VOCtrainval_06-Nov-2007

这个里面是具体的图片数据。

Annotations

里面是图片的标注信息,打开之后全是xml文件,文件名就是图像名称。

ImageSets

图像标签集合,里面划分了训练集、验证集、测试集。

这3个文件夹对应的是 VOC challenge 中3类不同的任务。

Main:对应 classification 和 detection 两个任务

在这里面一共有63个文件。

如何得到的:

train.txt、 trainval.txt、 val.txt:划分的训练集、验证集、测试集

剩余60个文件:20 * 3(类别名_train.txt、类别名_trainval.txt、类别名_val.txt ) = 60

VOC 2007 类别(20类):

  • person

  • bird, cat, cow, dog, horse, sheep

  • aeroplane, bicycle, boat, bus, car, motorbike, train

  • bottle, chair, dining table, pottedplant, sofa, tv/monitor

然后打开这些子类的文本文档的时候,会稍显不同,以 aeroplane_train.txt (飞机)为例:

该文件一共有2501行,说明此任务训练集图片共有2501个。在

图像ID 后面还有一个数字(-1,1,0)。

意义如下:

-1:表示当前图像中没有该类物体;

1:表示当前图像中有该类物体;

0:表示当前图像中该类物体只露出了一部分。

Layout、Segmentation 为另外两个任务。

所以这3个文件夹中包含的是3类不同的任务需要用到的不同的图片集合。

其中 Layout Segmentation

train.txt 表示的是训练集,val.txt 表示的是验证集, trainval.txt 是把前两者写到了一起

JPEGImages

里面全都是原始图片数据,一共有5011张个图像。

SegmentationClass

该文件夹是专门用于 Segmentation 任务的一个文件夹,里面存放的是 Segmentation 任务的 label 信息。用于Semantic segmentation [语义分割]。这里的图片共有20+1(背景色)种颜色

该文件夹中的图片共有422张,在 Imageseets/Segmentation 文件夹中的 trainval.txt 文档,也有422行。

SegmentationObject

用于 Instance Segmentation(实例分割)。在Class里面,一张图片里如果有多架飞机,那么会全部标注为红色。而在Object里面,同一张图片里面的飞机会被不同颜色标注出来。

四、VOCtest_06-Nov-2007

VOCtrainval_06-Nov-2007

五、数据下载

【目标检测数据集】VOC2007 数据集介绍

六、链接作者

欢迎关注我的公众号:@AI算法与电子竞赛

硬性的标准其实限制不了无限可能的我们,所以啊!少年们加油吧!

  • 18
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
目标检测算法是计算机视觉领域的一项重要任务,其主要目标是在图像或视频中准确地识别和定位特定物体。而在目标检测算法的性能评估中,通常会使用VOC2007数据集来进行检测性能的评估。 VOC2007数据集是一个广泛使用的目标检测基准数据集,包含20个不同类别的物体,如人、汽车、飞机等。该数据集中有9963张训练图像和2832张测试图像,旨在模拟真实世界中的物体检测场景。 针对VOC2007数据集目标检测算法,通常会使用各种深度学习模型和传统的计算机视觉算法。这些算法一般基于两阶段或单阶段的检测框架,其中两阶段框架包括R-CNN、Fast R-CNN和Faster R-CNN等,单阶段框架包括YOLO、SSD和RetinaNet等。 在VOC2007数据集上,目标检测算法的性能通常会通过计算准确率、召回率和平均精度(mean average precision,mAP)等指标来评估。准确率表示检测到的物体中真实物体的比例,召回率表示检测到的真实物体与数据集中所有真实物体的比例。而mAP综合考虑了准确率和召回率,是用来衡量目标检测算法性能的重要指标。 根据实验结果显示,目标检测算法在VOC2007数据集上取得了较好的检测性能。其中,一些先进的深度学习模型如Faster R-CNN、YOLOv3和RetinaNet等在VOC2007数据集上的mAP可以达到70%以上。 总的来说,在VOC2007数据集上进行目标检测算法的性能评估可以提供算法的基准性能,并且为研究人员和工程师提供了可比较的结果。目前的目标检测算法已经取得了显著进展,但仍需要进一步研究和改进以满足各种实际应用场景的需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

牧锦程

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值