PASCAL VOC数据集分析及下载、解压

由于跑代码过程中用到的是VOC2007数据集,就直接说明VOC2007数据集的下载与解压

一、数据集的下载与解压

Pascal VOC2007
1.输入以下命令下载训练、验证、测试数据和工具包

wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCdevkit_08-Jun-2007.tar

2.再把这些压缩文件解压到一个叫做VOCdevkit的文件夹下

tar xvf VOCtrainval_06-Nov-2007.tar
tar xvf VOCtest_06-Nov-2007.tar
tar xvf VOCdevkit_08-Jun-2007.tar

注意要同时输入这三句命令解压
3.然后可以看到应该有下面这样的结构:

$VOCdevkit/ # development kit
$VOCdevkit/VOCcode/ # VOC utility code
$VOCdevkit/VOC2007 # image sets, annotations, etc.
#… and several other directories …

(我的解压完如下)
在这里插入图片描述在这里插入图片描述

二、PASCAL VOC数据集的分析

(此处为参考多篇博客及其他资料学习后的总结,若有不对请多多指教)
首先提供官方下载地址:
https://pjreddie.com/projects/pascal-voc-dataset-mirror/
1.简介
PASCAL VOC从2005年开始举办挑战赛,内容从最开始的分类,到后面逐渐增加检测,分割,人体布局,动作识别(Object Classification 、Object Detection、Object Segmentation、Human Layout、Action Classification)等,数据集的容量以及种类也在不断的增加和改善。
本文主要分析PASCAL VOC数据集中和图像中物体识别相关的内容。
以PASCAL VOC2007为例,在一、数据集的下载与解压后在VOCdevkit目录下的VOC2007中看到如下的文件:
在这里插入图片描述其中Annotations、ImageSets和JPEGImages主要用于识别,SegmentationClass和SegmentationObject用于分割。

  • Annotations: 存放的是标记文件,采用xml格式,对JPEGImages文件夹中的每一张图片进行信息的标注。
    在这里插入图片描述例如000001.jpg和对应的xml文件具体如下:
    在这里插入图片描述
<annotation>
	<folder>VOC2007</folder>
	<filename>000001.jpg</filename>  # 文件名 
	<source>                          # 图像的来源
		<database>The VOC2007 Database</database>
		<annotation>PASCAL VOC2007</annotation>
		<image>flickr</image>
		<flickrid>341012865</flickrid>
	</source>
	<owner>                         #拥有者
		<flickrid>Fried Camels</flickrid>
		<name>Jinky the Fruit Bat</name>
	</owner>
	<size>  # 图像尺寸, 长、宽及通道数
		<width>353</width>
		<height>500</height>
		<depth>3</depth>
	</size>
	<segmented>0</segmented>  # 是否用于分割,在识别任务中0和1无所谓
	<object>               # 检测到的物体,表明这个是一个目标,下面的是与该目标相关的信息
		<name>dog</name>  # 物体类别
		<pose>Left</pose>  # 拍摄角度(包括:front, rear, left, right, unspecified )
		<truncated>1</truncated>  # 目标是否被截断(比如一部分在图片之外),或者被遮挡(超过15%),0代表完整
		<difficult>0</difficult>  # 检测难易程度,这个主要是根据目标的大小,光照变化,图片质量来判断,0代表容易识别
		<bndbox>      # bounding box 的左上角点和右下角点的4个坐标值
			<xmin>48</xmin>
			<ymin>240</ymin>
			<xmax>195</xmax>
			<ymax>371</ymax>
		</bndbox>
	</object>
	<object>        # 除了上边的又检测到的物体,表明检测到多个物体
		<name>person</name>
		<pose>Left</pose>
		<truncated>1</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>8</xmin>
			<ymin>12</ymin>
			<xmax>352</xmax>
			<ymax>498</ymax>
		</bndbox>
	</object>
</annotation>

  • ImageSets :存放的是图像数据,包含三个子文件夹 Layout、Main、Segmentation。其中 Main 存放的是用于分类和检测的数据集的分割文件,一共20个种类, Layout和Segmentation分别是人的身体部位和用于分割的数据。
    在这里插入图片描述其中Main文件夹中:包括
    _train.txt: 用于训练的图片名称
    _val.txt :用于验证的图片名称
    _trainval.txt: train与val的合集(训练数据和验证数据无交集,即一张图片不可能同时属于训练集又属于验证集)
    _test.txt :用于测试的图片名称
    在这里插入图片描述

每一个.txt文件打开后,如下:
在这里插入图片描述前面的是图像名称,后边的+1和-1分别代表正负样本。上图即代表在训练集这张图片(000012)aeroplane的话为1,不是则为-1。其他所有的 (class)_(imgset).txt 文件都是类似的。

### 回答1: Pascal VOC(Visual Object Classes)数据集包含了一系列用于目标检测、图像分割、人体姿态估计等计算机视觉任务的图像和相应的标注。该数据集可以从以下链接下载: - 官方网站:http://host.robots.ox.ac.uk/pascal/VOC/ - Github镜像:https://github.com/philkr/voc-dataset-mirror 下载方法: 1. 访问上述链接,找到“Download Data”或“Download”按钮。 2. 选择要下载的年份和任务类型,如“VOC2012 segmentation data”或“VOC2007 detection data”。 3. 点击下载按钮,下载数据集的压缩文件。 4. 解压缩文件,即可得到包含图像和标注的文件夹。 ### 回答2: Pascal VOC数据集是一个常用的目标检测和图像分割领域的数据集,包含大量带有标注的图像。可以从下面的步骤来下载Pascal VOC数据集: 1. 首先,打开Pascal VOC官方网站(http://host.robots.ox.ac.uk/pascal/VOC/),在该网页上会有关于Pascal VOC数据集所有相关的信息。 2. 在网页上找到"Download the Pascal VOC dataset"这个链接,点击进入。 3. 在下载页面上,你可以选择下载不同年份的数据集。根据你的需求,选择想要下载的年份,点击相应链接进入下载页面。 4. 进入下载页面后,会看到一个表格,列出了所有数据集下载链接。通常会有两个下载选项:Images和Annotations。 5. 点击Images链接,下载图像数据集。这些图像通常以压缩格式(如.tar或.zip)提供,你可以选择下载单个图像集或是整个数据集。 6. 点击Annotations链接,下载标注数据集。标注数据集包含了对每个图像的目标位置、类别等标注信息。同样,你也可以选择下载单个标注集或是整个数据集。 7. 根据下载的文件类型,你可能需要使用一些解压缩工具(如WinRAR、7-Zip等)来解压下载的文件。 总结起来,下载Pascal VOC数据集的步骤包括打开官方网站、选择下载年份、下载图像和标注数据集,并使用解压缩工具解压文件。 ### 回答3: Pascal VOC数据集是一个常用的计算机视觉数据集,包含多个类别的图像和对应的标注信息。它广泛应用于目标检测、图像分割等任务的研究和评估。 Pascal VOC数据集可以在其官方网站上下载。访问网站https://pjreddie.com/projects/pascal-voc-dataset-mirror/ ,可以找到下载页面。在这个页面上,列有多个年份的数据集,点击所需年份的压缩文件进行下载下载数据集的具体步骤如下: 1. 打开Pascal VOC数据集官方网站。 2. 在下载页面上,找到所需年份的压缩文件并点击下载。 3. 下载完成后,可以使用解压软件将压缩文件解压到指定的文件夹中。 需要注意的是,Pascal VOC数据集非常大,总大小达到几十GB。因此,在下载解压缩过程中需要耐心等待,并确保有足够的存储空间。 下载完成后,数据集中的图像和标注信息(如边界框和类别标签)可以用于训练模型、评估算法性能等任务。可以根据具体需求使用相应的工具和框架来处理和使用这些数据。 总之,Pascal VOC数据集可以在官方网站上进行下载,按照年份选择所需的数据集压缩文件进行下载,并使用解压软件解压缩到指定的文件夹中。下载过程需要耐心等待和足够的存储空间。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值