PASCAL VOC2012数据集分析

PASCAL VOC2012是一个计算机视觉挑战赛的数据集,涉及图像分类、检测和分割任务。数据集包含20个类别,如人、动物、车辆等,并提供了XML标签文件、图像数据及分割信息。图像分类和检测任务要求对图像进行正确分类和定位,图像分割则分为实例分割和语义分割。数据集分为训练、验证和训练验证集,适用于深度学习模型的开发和评估。

Pascal VOC2012官网地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
PASCAL VOC论文:http://host.robots.ox.ac.uk/pascal/VOC/pubs/everingham15.pdf

一、简介

PASCAL VOC挑战赛 (The PASCAL Visual Object Classes Challenge)是关于计算机视觉的挑战赛,PASCAL VOC挑战赛主要包括以下几类:分类(Classification),检测(Detection),分割(Segmentation),行为识别(Action Classification) 等。
- 图像分类与检测
分类:在测试图像预测是否为二十个分类之一,正确分类。
检测:在测试图像上预测二十个分类对象的有无与位置信息。
在这里插入图片描述
- 图像分割
分割:图像分割一般包括实例分割和语义分割,实例分割是要把每个单独的目标用一种颜色表示(如下图中间的图像),而语义分割只是把同一类别的所有目标用同一颜色表示(如下图右侧的图片)。
在这里插入图片描述
- 行为识别
行为识别:预测图像中人的行为动作
在这里插入图片描述
- Person Layout标注
Person Layout标注:检测人与其各个身体组成部分,如果手、脚、头等。

二、PASCAL VOC2012数据集

Pascal VOC2012数据集主要是针对视觉任务中监督学习提供标签数据,它有二十个类别:
Person:person
Animal: bird, cat, cow, dog, horse, sheep
Vehicle:aeroplane, bicycle, boat, bus, car, motorbike, train
Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor
下载路径: http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html#devkit
下载完之后解压文件,打开VOCdevkit-VOC2012可以看到如下文件。
在这里插入图片描述
Annotations文件夹
Annotations文件夹中存放的是xml格式的标签文件,每一个xml文件都对应于JPEGImages文件夹中的一张图片,一共有17125个项目文件。
在这里插入图片描述
xml文件具体格式如下图所示,

<annotation>
	<folder>VOC2012</folder>
	<filename>2007_000027.jpg</filename>  //文件名
	<source>  //图片来源
		<database>The VOC2007 Database</database>
		<annotation>PASCAL VOC2007</annotation
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值