PASCAL-VOC2012数据集介绍

序言

数据集摘要:包含可用于Classification、Detection、Segmentation三大CV任务的高质量标注数据。

                                 

PASCAL-VOC官方主页:http://host.robots.ox.ac.uk/pascal/VOC/

PASCAL-VOC2012官方介绍:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html

数据集的官方介绍文章:The PASCAL Visual Object Classes Challenge: A Retrospective[2015-IJCV]

PASCAL-VOC2012数据集下载链接:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar [1.9G]

数据集结构

下载PASCAL-VOC2012解压后得到VOC2012文件夹,进入VOC2012文件夹后,得到:

                      

JPEGImages

 JPEGImages文件夹中包含PASCAL-VOC2012数据集的所有图片,共计17125张。图片的命名格式为year_%6d.jpg,其中year表示该图片被加入到数据集的年份,%6d表示长度为6位的image_index。这些图片的尺寸大小不一,但是横向图的尺寸大约在375x500左右,纵向图的尺寸大约在500x375左右,基本不会偏差超过100。

                                                    

 

ImageSets

                                    

1. Action

ImageSet包含4个文件夹,其中Action文件夹中包含10类常见的人体动作{jumping, phoning, playinginstrument, reading, ridingbike, ridinghorse, running, takingphoto, usingcomputer. walking}.一共包含33个关于样本划分的文本文件,其中10组组内划分文件[action_train.txt, action_trainval.txt, action_val.txt],外加一组[train.txt, trainval.txt, val.txt],它是整体样本的划分文件。

     

以jumping_train.txt文件为例,它包含三列,依次为图片的名称、图片中object的index、label{1:正类样本, -1:负类样本}。

2. Layout

包含一组文本文件:train.txt, trainval.txt, val.txt,它用于预测人体的头、手、脚这三部分的bbox,并对bbox内的object分类。

                                          

各文本文件都有2列,依次表示:图片名称、图片包含的人数。

3. Main

包含63个文本文件,其中20个类的划分文件[class_train.txt, class_trainval.txt, class_val.txt],外加以一组全局样本的[train.txt, trainval.txt, val.txt]划分文件。

                                                        

 ###_train.txt、_trainval.txt、_val.txt文件包含2列,依次表示:文件名、label[1:表示正类样本,-1:表示负类样本]。

4. Segmentation

只包含一组[train.txt, trainval.txt, val.txt]文件,各文件只有1列,为图片名称。

Annotations

文件夹中包含数据集全部图片[17125]的标注信息,标注文件以year_index.xml格式存储。下面以2007_000039.xml为例分析:

   

SegmentationClass

该文件夹下共有2913张year_index.png格式的图片,用于Semantic segmentation[语义分割]。这里的图片共有20+1(背景色)种颜色,例如:所有的狗都被标注为浅紫色,猫为咖啡色,注意这里是.png格式的图片[如果为其它格式,在存储的时候由于压缩、编码等原因会产生浮点型值]。

                       

SegmentationObject

该文件夹下也包含2913张图片,存储格式与SegmentationClass中图片的存储格式一致,用于Instance segmentation[实例分割]。在Class里面,一张图片里如果有多架飞机,那么会全部标注为红色。而在Object里面,同一张图片里面的飞机会被不同颜色标注出来。

                          

 

  • 5
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ReLuJie

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值