目标检测PASCAL VOC 数据集简介

最新推荐文章于 2023-03-24 16:07:22 发布

追逐AI的蜗牛

最新推荐文章于 2023-03-24 16:07:22 发布

阅读量252

点赞数

分类专栏：目标检测文章标签：目标检测detection voc数据集

本文链接：https://blog.csdn.net/qq_38675397/article/details/105584157

版权

目标检测专栏收录该内容

9 篇文章 2 订阅

订阅专栏

官网：

http://host.robots.ox.ac.uk/pascal/VOC/

镜像：

https://pjreddie.com/projects/pascal-voc-dataset-mirror/

一、简介

PASCAL VOC 挑战赛主要有 Object Classification 、Object Detection、Object Segmentation、Human Layout、Action Classification 这几类子任务
PASCAL VOC 2007 和 2012 数据集总共分 4 个大类：vehicle、household、animal、person，总共 20 个小类（加背景 21 类），预测的时候是只输出下图中黑色粗体的类别

VOCdevkit文件夹

数据集下载后解压得到一个名为VOCdevkit的文件夹，该文件夹结构如下：

.
└── VOCdevkit     #根目录
    └── VOC2012   #不同年份的数据集，这里只下载了2012的，还有2007等其它年份的
        ├── Annotations        #存放xml文件，与JPEGImages中的图片一一对应，解释图片的内容等等
        ├── ImageSets          #该目录下存放的都是txt文件，txt文件中每一行包含一个图片的名称，末尾会加上±1表示正负样本
        │   ├── Action
        │   ├── Layout
        │   ├── Main
        │   └── Segmentation
        ├── JPEGImages         #存放源图片
        ├── SegmentationClass #存放的是图片，语义分割相关
        └── SegmentationObject #存放的是图片，实例分割相关

Annotation文件夹存放的是xml文件，该文件是对图片的解释，每张图片都对于一个同名的xml文件。
ImageSets文件夹存放的是txt文件，这些txt将数据集的图片分成了各种集合。如Main下的train.txt中记录的是用于训练的图片集合
JPEGImages文件夹存放的是数据集的原图片
SegmentationClass以及SegmentationObject文件夹存放的都是图片，且都是图像分割结果图

Annotation文件夹

Annotation文件夹的内容如下：

其中xml主要介绍了对应图片的基本信息，如来自那个文件夹、文件名、来源、图像尺寸以及图像中包含哪些目标以及目标的信息等等，内容如下：

<annotation>
   <folder>VOC2007</folder>
   <filename>000001.jpg</filename> # 文件名
   <source>
       <database>The VOC2007 Database</database>
       <annotation>PASCAL VOC2007</annotation>
       <image>flickr</image>
       <flickrid>341012865</flickrid>
   </source>
   <owner>
       <flickrid>Fried Camels</flickrid>
       <name>Jinky the Fruit Bat</name>
   </owner>
   <size> # 图像尺寸, 用于对 bbox 左上和右下坐标点做归一化操作
       <width>353</width>
       <height>500</height>
       <depth>3</depth>
   </size>
   <segmented>0</segmented> # 是否用于分割
   <object>
       <name>dog</name> # 物体类别
       <pose>Left</pose> # 拍摄角度：front, rear, left, right, unspecified
       <truncated>1</truncated> # 目标是否被截断（比如在图片之外），或者被遮挡（超过15%）
       <difficult>0</difficult> # 检测难易程度，这个主要是根据目标的大小，光照变化，图片质量来判断
       <bndbox>
           <xmin>48</xmin>
           <ymin>240</ymin>
           <xmax>195</xmax>
           <ymax>371</ymax>
       </bndbox>
   </object>
   <object>
       <name>person</name>
       <pose>Left</pose>
       <truncated>1</truncated>
       <difficult>0</difficult>
       <bndbox>
           <xmin>8</xmin>
           <ymin>12</ymin>
           <xmax>352</xmax>
           <ymax>498</ymax>
       </bndbox>
   </object>
</annotation>

ImageSets

包括 Action，Layout，Main，Segmentation 四个文件夹

    Action：存放的是人的动作（例如running、jumping等等，这也是VOC challenge的一部分）
    Layout：存放的是具有人体部位的数据（人的head、hand、feet等等，这也是VOC challenge的一部分
    Main：存放的是图像物体识别的数据，总共分为20类。
    Segmentation：存放的是可用于分割的数据。

ImageSets/Main/ 文件夹下

{class}_train.txt 保存类别为 class 的训练集的所有索引，每一个 class 的 train 数据都有 5717 个。
{class}_val.txt 保存类别为 class 的验证集的所有索引，每一个 class 的val数据都有 5823 个
{class}_trainval.txt 保存类别为 class 的训练验证集的所有索引，每一个 class 的val数据都有11540 个

VOC2012/ImageSets/Main/train.txt 保存了所有训练集的文件名，从 VOC2012/JPEGImages/ 找到文件名对应的图片文件。VOC2012/Annotations/ 找到文件名对应的标签文件

VOC2012/ImageSets/Main/val.txt 保存了所有验证集的文件名，从 VOC2012/JPEGImages/ 找到文件名对应的图片文件。VOC2012/Annotations/ 找到文件名对应的标签文件

VOC2012/ImageSets/Main/trainval.txt 保存了所有训练验证集的文件名，从 VOC2012/JPEGImages/ 找到文件名对应的图片文件。VOC2012/Annotations/ 找到文件名对应的标签文件

追逐AI的蜗牛

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
目标检测PASCAL VOC 数据集简介

一、简介 PASCAL VOC 挑战赛主要有 Object Classification 、Object Detection、Object Segmentation、Human Layout、Action Classification 这几类子任务 PASCAL VOC 2007 和 2012 数据集总共分 4 个大类：vehicle、household、animal、perso...
复制链接

扫一扫

专栏目录