目标检测数据集VOC 2007/2012 整理

最新推荐文章于 2025-03-07 06:29:46 发布

liguiyuan112

最新推荐文章于 2025-03-07 06:29:46 发布

阅读量9.1k

点赞数 8

分类专栏： AI 文章标签：深度学习

本文链接：https://blog.csdn.net/u012505617/article/details/104576840

版权

AI 专栏收录该内容

42 篇文章

订阅专栏

做目标检测时我们经常用到voc 2007, voc 2012 数据集，今天就来整理一下。

数据集的下载地址： https://pjreddie.com/projects/pascal-voc-dataset-mirror/

voc 2007

数据集包含 训练集：5011 张，测试集：4952张，共9963张，20个类。

20个类分别为：

aeroplane
bicycle
bird
boat
bottle
bus
car
cat
chair
cow
diningtable
dog
horse
motorbike
person
pottedplant
sheep
sofa
train
tvmonitor

VOC2007 ，我们解压训练集后看到的文件目录：

目录的结构如下：

├── Annotations # 里面存放 .xml 文件，图片的标签，比如坐标位置信息等。
├── ImageSets # 这个目录下有三个文件夹，文件夹存放的都是 .txt 文件，类别标签
│   ├── Layout
│   ├── Main # Main 目录下
│   └── Segmentation
├── JPEGImages # 图像文件 .jpg 格式
├── labels
├── SegmentationClass # 存放的是图片文件，分割后的图片
└── SegmentationObject # 存放的是图片文件，分割后的图片

Annotations：存放 xml格式文件，每一个xml文件名对应JPEGImages 中的一张图片。xml文件里是对图片的解释，想了解可以自己看。

ImageSets：里面有三个文件夹Layout，Main，Segmentation

layout：存放的是人体部位的数据
Main：存放物体识别的分类数据，里面有 xx_train.txt, xx_test.txt , xx_trainval.txt, xx_val.txt 文件，xx表示分类，总共20类。
Segmentation：存放可用于分割的数据

我们做目标检测，只需要关注Main文件夹即可。

voc 2012

下载地址：http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar

voc 2012 数据集是voc 2007的升级版，一共11530张图片，数据集分为20类（包含背景21）。

人：人

动物：鸟、猫、牛、狗、马、羊

车辆：飞机、自行车、船、巴士、汽车、摩托车、火车

室内：瓶、椅子、餐桌、盆栽植物、沙发、电视/监视器

voc2012 数据集和2007结构是一样的，文件夹存放的东西也类似：

├── Annotations # .xml 文件，文件里面是对图片的解释
├── ImageSets # 里面包含四个文件，文件夹下面存放 .txt文件
│   ├── Action
│   ├── Layout
│   ├── Main
│   └── Segmentation
├── JPEGImages # 原图片
├── labels
├── SegmentationClass # 分割后的图片
└── SegmentationObject   # 分割后的图片

ImageSets 目录下：