做目标检测时我们经常用到voc 2007, voc 2012 数据集,今天就来整理一下。
数据集的下载地址: https://pjreddie.com/projects/pascal-voc-dataset-mirror/
voc 2007
数据集包含 训练集:5011 张,测试集:4952张,共9963张,20个类。
20个类分别为:
aeroplane
bicycle
bird
boat
bottle
bus
car
cat
chair
cow
diningtable
dog
horse
motorbike
person
pottedplant
sheep
sofa
train
tvmonitor
VOC2007 ,我们解压训练集后看到的文件目录:
目录的结构如下:
├── Annotations # 里面存放 .xml 文件,图片的标签,比如坐标位置信息等。
├── ImageSets # 这个目录下有三个文件夹,文件夹存放的都是 .txt 文件,类别标签
│ ├── Layout
│ ├── Main # Main 目录下
│ └── Segmentation
├── JPEGImages # 图像文件 .jpg 格式
├── labels
├── SegmentationClass # 存放的是图片文件,分割后的图片
└── SegmentationObject # 存放的是图片文件,分割后的图片
Annotations:存放 xml格式文件,每一个xml文件名对应JPEGImages 中的一张图片。xml文件里是对图片的解释,想了解可以自己看。
ImageSets:里面有三个文件夹Layout,Main,Segmentation
- layout:存放的是人体部位的数据
- Main:存放物体识别的分类数据,里面有 xx_train.txt, xx_test.txt , xx_trainval.txt, xx_val.txt 文件,xx表示分类,总共20类。
- Segmentation:存放可用于分割的数据
我们做目标检测,只需要关注Main文件夹即可。
voc 2012
下载地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
voc 2012 数据集是voc 2007的升级版,一共11530张图片,数据集分为20类(包含背景21)。
人:人
动物:鸟、猫、牛、狗、马、羊
车辆:飞机、自行车、船、巴士、汽车、摩托车、火车
室内:瓶、椅子、餐桌、盆栽植物、沙发、电视/监视器
voc2012 数据集和2007结构是一样的,文件夹存放的东西也类似:
├── Annotations # .xml 文件,文件里面是对图片的解释
├── ImageSets # 里面包含四个文件,文件夹下面存放 .txt文件
│ ├── Action
│ ├── Layout
│ ├── Main
│ └── Segmentation
├── JPEGImages # 原图片
├── labels
├── SegmentationClass # 分割后的图片
└── SegmentationObject # 分割后的图片
ImageSets 目录下:
- Action:存放的是人的动作(例如running、jumping等等,这也是VOC challenge的一部分)
- Layout:存放的是具有人体部位的数据(人的head、hand、feet等等,这也是VOC challenge的一部分)
- Main:存放的是图像物体识别的数据,总共分为20类
- Segmentation:存放的是可用于分割的数据
参考:
https://blog.csdn.net/qq_41185868/article/details/79927556
https://blog.csdn.net/weixin_42142612/article/details/83142213