1. 官网链接
- PASCAL-VOC2012官网链接:pascal/VOC/voc2012
- 点击可直接下载:👉下载VOC2012-2GB
- 点击可定位到下载的位置,查看包含了哪些:Development Kit
- 🍀还是我云导师讲得清楚!👉PASCAL VOC2012数据集介绍
2. 包含20个类别
VOC2012数据集分为20类,包括背景为21类,分别如下:
Person (1类)
: personAnimal (6类)
: bird, cat, cow, dog, horse, sheepVehicle (7类)
: aeroplane, bicycle, boat, bus, car, motorbike, trainIndoor (6类)
: bottle, chair, dining table, potted plant, sofa, tv/monitor
3. 数据集详情
- 深度学习图像分割(一)——PASCAL-VOC2012数据集(vocdevkit、Vocbenchmark_release)详细介绍
- 语义分割数据集详解(PASCAL-VOC2012,Vocbenchmark,Cityscapes)
像素类别顺序是:(按照字母顺序排列)
pixel indices correspond to classes in alphabetical order :
(1=aeroplane, 2=bicycle, 3=bird, 4=boat, 5=bottle, 6=bus, 7=car , 8=cat, 9=chair, 10=cow, 11=diningtable, 12=dog, 13=horse, 14=motorbike, 15=person, 16=potted plant, 17=sheep, 18=sofa, 19=train, 20=tv/monitor)
这里只说与图像分割(segmentation)有关的信息,VOC2012中的图片并不是都用于分割,用于分割比赛的图片实例如下,包含:
Image
:原图SegmentationClass
:图像分类分割(这里的2
和3
都是用于分割的8bit的PNG类型图像,其中2
是用于语义分割,3
是用于实例分割)SegmentationObject
:图像物体分割
SegmentationClass
是在20种物体中,ground-turth图片上每个物体的轮廓填充都有一个特定的颜色,一共20种颜色,比如摩托车用红色表示,人用绿色表示。而SegmentationObject
则仅仅在一副图中生成不同物体的轮廓颜色即可,颜色自己随便填充。
4. 文件夹排布
VOCdevkit
└── VOC2012
├── Annotations 所有的图像标注信息(XML文件)
├── ImageSets
│ ├── Action 人的行为动作图像信息
│ ├── Layout 人的各个部位图像信息
│ │
│ ├── Main 目标检测分类图像信息
│ │ ├── train.txt 训练集(5717)
│ │ ├── val.txt 验证集(5823)
│ │ └── trainval.txt 训练集+验证集(11540)
│ │
│ └── Segmentation 目标分割图像信息
│ ├── train.txt 训练集(1464)
│ ├── val.txt 验证集(1449)
│ └── trainval.txt 训练集+验证集(2913)
│
├── JPEGImages 所有图像文件
├── SegmentationClass 语义分割png图(基于类别)
└── SegmentationObject 实例分割png图(基于目标)
5. 类别索引与名称对应关系
下面给出在Pascal VOC数据集中各目标类别名称与类别索引对应关系:
{
"background": 0,
"aeroplane": 1,
"bicycle": 2,
"bird": 3,
"boat": 4,
"bottle": 5,
"bus": 6,
"car": 7,
"cat": 8,
"chair": 9,
"cow": 10,
"diningtable": 11,
"dog": 12,
"horse": 13,
"motorbike": 14,
"person": 15,
"pottedplant": 16,
"sheep": 17,
"sofa": 18,
"train": 19,
"tvmonitor": 20
}
aeroplane
bicycle
bird
boat
bottle
bus
car
cat
chair
cow
diningtable
dog
horse
motorbike
person
pottedplant
sheep
sofa
train
tvmonitor