【目标检测数据集】VOC2007 数据集介绍

牧锦程

已于 2024-04-13 19:58:35 修改

阅读量1.1k

点赞数 18

分类专栏：数据集文章标签：目标检测人工智能计算机视觉

于 2024-04-13 19:57:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_48764574/article/details/137723650

版权

数据集专栏收录该内容

7 篇文章 0 订阅

订阅专栏

一、介绍

VOC 数据是 PASCAL VOC Challenge 用到的数据集，官网：http://host.robots.ox.ac.uk/pascal/VOC/

备注：VOC数据集常用的均值为：mean_RGB=(122.67891434, 116.66876762, 104.00698793)

Pytorch 上通用的数据集的归一化指标为：mean=(0.485, 0.456, 0.406) , std=(0.229, 0.224, 0.225)

voc2007 官网：http://host.robots.ox.ac.uk/pascal/VOC/voc2007/index.html

注意：在 VOC 官方给出的数据集中，只有 VOC2007 是给出了带有标记的测试集的。其他年份的数据集是没有给测试集，只给的有带标记的验证集。

二、VOCdevikit

里面是开发工具包代码和文档。解压后如下：

如图所示，里面是一些 MATLAB 代码，就是用这些代码处理的这个数据集，具体可以看看 devkit_doc.pdf，就是一个比较详细的说明书。

三、VOCtrainval_06-Nov-2007

这个里面是具体的图片数据。

Annotations

里面是图片的标注信息，打开之后全是xml文件，文件名就是图像名称。

ImageSets

图像标签集合，里面划分了训练集、验证集、测试集。

这3个文件夹对应的是 VOC challenge 中3类不同的任务。

Main：对应 classification 和 detection 两个任务

在这里面一共有63个文件。

如何得到的：

train.txt、 trainval.txt、 val.txt：划分的训练集、验证集、测试集

剩余60个文件：20 * 3（类别名_train.txt、类别名_trainval.txt、类别名_val.txt ） = 60

VOC 2007 类别（20类）：

person
bird, cat, cow, dog, horse, sheep
aeroplane, bicycle, boat, bus, car, motorbike, train
bottle, chair, dining table, pottedplant, sofa, tv/monitor

然后打开这些子类的文本文档的时候，会稍显不同，以 aeroplane_train.txt （飞机）为例：

该文件一共有2501行，说明此任务训练集图片共有2501个。在

图像ID 后面还有一个数字（-1，1，0）。

意义如下：

-1：表示当前图像中没有该类物体；

1：表示当前图像中有该类物体；

0：表示当前图像中该类物体只露出了一部分。

Layout、Segmentation 为另外两个任务。

所以这3个文件夹中包含的是3类不同的任务需要用到的不同的图片集合。

其中 Layout 和 Segmentation：

train.txt 表示的是训练集，val.txt 表示的是验证集， trainval.txt 是把前两者写到了一起

JPEGImages

里面全都是原始图片数据，一共有5011张个图像。

SegmentationClass

该文件夹是专门用于 Segmentation 任务的一个文件夹，里面存放的是 Segmentation 任务的 label 信息。用于Semantic segmentation [语义分割]。这里的图片共有20+1(背景色)种颜色。

该文件夹中的图片共有422张，在 Imageseets/Segmentation 文件夹中的 trainval.txt 文档，也有422行。

SegmentationObject

用于 Instance Segmentation（实例分割）。在Class里面，一张图片里如果有多架飞机，那么会全部标注为红色。而在Object里面，同一张图片里面的飞机会被不同颜色标注出来。

四、VOCtest_06-Nov-2007

同 VOCtrainval_06-Nov-2007

五、数据下载

【目标检测数据集】VOC2007 数据集介绍

六、链接作者

欢迎关注我的公众号：@AI算法与电子竞赛

硬性的标准其实限制不了无限可能的我们，所以啊！少年们加油吧！

关注

18
点赞
踩
11

收藏

觉得还不错? 一键收藏
打赏
0
评论
【目标检测数据集】VOC2007 数据集介绍

VOC 数据是 PASCAL VOC Challenge 用到的数据集，官网：http://host.robots.ox.ac.uk/pascal/VOC/备注：VOC数据集常用的均值为：Pytorch 上通用的数据集的归一化指标为：voc2007 官网：http://host.robots.ox.ac.uk/pascal/VOC/voc2007/index.html注意：在 VOC 官方给出的数据集中，只有 VOC2007 是给出了带有标记的测试集的。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

牧锦程 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。