PASCAL VOC数据集

hongtao_20200705

于 2022-04-27 10:59:49 发布

阅读量84

点赞数

分类专栏：目标检测文章标签：目标检测

原文链接：https://blog.csdn.net/qq_37541097/article/details/115787033

版权

目标检测专栏收录该内容

2 篇文章 0 订阅

订阅专栏

简介：

PASCAL VOC挑战赛（The PASCAL Visual Object Classes）是一个世界级的计算机视觉挑战赛，PASCAL全称：Pattern Analysis，Statical Modeling and Computational Learning，是一个由欧盟资助的网络组织。
PASCAL VOC挑战赛主要包括以下几类：

1.Aeroplane
2.Bicycle
3.Boat
4.Bus
5.Car
6.Motorbike
7.Train
8.Bottle
9.Chair
10.Dining table
11.Potted plant
12.Sofa
13.TV/Monitor
14.Bird
15.Cat
16.Cow
17.Dog
18.Horse
19.Sheep
20.Person

图像分类（Object Classification），目标检测（Object Detection），目标分割（Object Segmentation），动作识别（Action Classification）等。

PASCAL VOC2012数据集：

The PASCAL Visual Object Classes Challenge 2012 (VOC2012)http://host.robots.ox.ac.uk/pascal/VOC/voc2012/

数据集文件目录结构

VOCdevkit
    └── VOC2012
         ├── Annotations               所有的图像标注信息(XML文件)
         ├── ImageSets    
         │   ├── Action                人的行为动作图像信息
         │   ├── Layout                人的各个部位图像信息
         │   │
         │   ├── Main                  目标检测分类图像信息
         │   │     ├── train.txt       训练集(5717)
         │   │     ├── val.txt         验证集(5823)
         │   │     └── trainval.txt    训练集+验证集(11540)
         │   │
         │   └── Segmentation          目标分割图像信息
         │         ├── train.txt       训练集(1464)
         │         ├── val.txt         验证集(1449)
         │         └── trainval.txt    训练集+验证集(2913)
         │ 
         ├── JPEGImages                所有图像文件
         ├── SegmentationClass         语义分割png图（基于类别）
         └── SegmentationObject        实例分割png图（基于目标）

# train.txt、val.txt和trainval.txt文件里记录的是对应标注文件的索引，每一行对应一个索引信息

如何使用数据集中目标检测的数据：

首先在Main文件中，读取对应的txt文件（注意，在Main文件夹里除了train.txt、val.txt和trainval.txt文件外，还有针对每个类别的文件，例如bus_train.txt、bus_val.txt和bus_trainval.txt）。比如使用train.txt中的数据进行训练，那么读取该txt文件，解析每一行。上面说了每一行对应一个标签文件的索引。

   ├── Main                  目标检测分类图像信息
   │     ├── train.txt       训练集(5717)
   │     ├── val.txt         验证集(5823)
   │     └── trainval.txt    训练集+验证集(11540)

接着通过索引在Annotations文件夹下找到对应的标注文件（.xml）。比如索引为2007_000323，那么在Annotations文件夹中能够找到2007_000323.xml文件。如下图所示，在标注文件中包含了所有需要的信息，比如filename，通过在字段能够在JPEGImages文件夹中能够找到对应的图片。size记录了对应图像的宽、高以及channel信息。每一个object代表一个目标，其中的name记录了该目标的名称，pose表示目标的姿势（朝向），truncated表示目标是否被截断（目标是否完整），difficult表示该目标的检测难易程度（0代表简单，1表示困难），bndbox记录了该目标的边界框信息。

接着通过在标注文件中的filename字段在JPEGImages文件夹中找到对应的图片。比如在2007_000323.xml文件中的filename字段为2007_000323.jpg，那么在JPEGImages文件夹中能够找到2007_000323.jpg文件。

如何使用该数据集中语义分割的数据

首先在Segmentarion文件中，读取对应的txt文件。比如使用train.txt中的数据进行训练，那么读取该txt文件，解析每一行，每一行对应一个图像的索引。

  └── Segmentation          目标分割图像信息
        ├── train.txt       训练集(1464)
        ├── val.txt         验证集(1449)
        └── trainval.txt    训练集+验证集(2913)

根据索引在JPEGImages文件夹中找到对应的图片。还是以2007_000323为例，可以找到2007_000323.jpg文件。
根据索引在SegmentationClass文件中找到相应的标注图像（.png）。还是以2007_000323为例，可以找到2007_000323.png文件。

注意，在语义分割中对应的标注图像（.png）用PIL的Image.open()函数读取时，默认是P模式，即一个单通道的图像。在背景处的像素值为0，目标边缘处用的像素值为255(训练时一般会忽略像素值为255的区域)，目标区域内根据目标的类别索引信息进行填充，例如人对应的目标索引是15，所以目标区域的像素值用15填充。

Pascal VOC数据集中各目标类别名称与类别索引对应关系：

{
	"background": 0,
    "aeroplane": 1,
    "bicycle": 2,
    "bird": 3,
    "boat": 4,
    "bottle": 5,
    "bus": 6,
    "car": 7,
    "cat": 8,
    "chair": 9,
    "cow": 10,
    "diningtable": 11,
    "dog": 12,
    "horse": 13,
    "motorbike": 14,
    "person": 15,
    "pottedplant": 16,
    "sheep": 17,
    "sofa": 18,
    "train": 19,
    "tvmonitor": 20
}

创建自己的数据集：

标注图像软件：https://github.com/tzutalin/labelImg

参考：https://blog.csdn.net/qq_37541097/article/details/115787033

hongtao_20200705

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PASCAL VOC数据集

简介：PASCAL VOC挑战赛（The PASCAL Visual Object Classes）是一个世界级的计算机视觉挑战赛，PASCAL全称：Pattern Analysis，Statical Modeling and Computational Learning，是一个由欧盟资助的网络组织。PASCAL VOC挑战赛主要包括以下几类：1.Aeroplane2.Bicycle3.Boat4.Bus5.Car6.Motorbike7.Train8.Bottle9.Cha..
复制链接

扫一扫

专栏目录