PASCAL VOC2012数据集内容解读

本文详细介绍了PASCAL VOC数据集的结构,包括Annotations中的XML信息,如图像尺寸、边界框和对象标注,以及train.txt、val.txt和trainval.txt等文件的作用。此外,还探讨了Main目录下的文件格式,用于目标检测和分类任务。
摘要由CSDN通过智能技术生成

1.总体结构

Annotations——所有图像标注信息,XML格式

ImageSets——图像信息

Action——人的行为动作图像信息

Layout——人的各个部位图像信息

Main——目标检测分类图像信息

train.txt——训练集5717

val.txt——验证集5823

JPEGImage——图片png格式

trainval.txt——训练集+验证集11540

Segmentation——目标分割图像信息

SegmentationClass——图像分割png图(基于类别)

SegmentationObject——图像分割png图(基于坐标)

2.Annotations中文件——以一个xml文件2007_000027.xml为例,以此类推。

<annotation>
	<folder>VOC2012</folder>
	<filename>2007_000027.jpg</filename>
	<source>
		<database>The VOC2007 Database</database>
		<annotation>PASCAL VOC2007</annotation>
		<image>flickr</image>
	</source>
	<size>
		<width>486</width>
		<height>500</height>
		<depth>3</depth>
	</size>
	<segmented>0</segmented>
	<object>
		<name>person</name>
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>174</xmin>
			<ymin>101</ymin>
			<xmax>349</xmax>
			<ymax>351</ymax>
		</bndbox>
		<part>
			<name>head</name>
			<bndbox>
				<xmin>169</xmin>
				<ymin>104</ymin>
				<xmax>209</xmax>
				<ymax>146</ymax>
			</bndbox>
		</part>
		<part>
			<name>hand</name>
			<bndbox>
				<xmin>278</xmin>
				<ymin>210</ymin>
				<xmax>297</xmax>
				<ymax>233</ymax>
			</bndbox>
		</part>
		<part>
			<name>foot</name>
			<bndbox>
				<xmin>273</xmin>
				<ymin>333</ymin>
				<xmax>297</xmax>
				<ymax>354</ymax>
			</bndbox>
		</part>
		<part>
			<name>foot</name>
			<bndbox>
				<xmin>319</xmin>
				<ymin>307</ymin>
				<xmax>340</xmax>
				<ymax>326</ymax>
			</bndbox>
		</part>
	</object>
</annotation>

靠缩进来表达节点包含关系,加/表示该节点结束。

<annotation>——注释,说明这是给数据集中一个图片的注释

<folder>——文件夹,所在文件夹为VOC2012

<filename>——对应的文件名为2007_000027.jpg,此文件在

<source>——来源于哪? 

<size>——图像尺寸,width宽486,height高500,由于是RGB图片,depth深度或通道数为3.

<segmented>——被分割没?0没,1有。

<object>——对象,name类别名,pose未被指明,truncated目标截断情况(是否完整),difficult进行目标检测时的难以程度,0不难,1难。

<bndbox>——bounding box边缘框,给的是左上与右下的坐标。

3.train.txt文件内容节选。val.txt和trainval.txt同理。

2008_000008
2008_000015
2008_000019
2008_000023
2008_000028
2008_000033
2008_000036

都为图像名称。trainval.txt是最后用来训练网络最后在测试集中测试。

4.main中文件

2008_000008 -1
2008_000015 -1
2008_000019 -1
2008_000023 -1
2008_000028 -1
2008_000033  1
2008_000036 -1

-1没出现,1出现了,0难检测。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Pascal VOC 2012数据集是一个广泛使用的计算机视觉数据集,包含20个物体类别的图像数据和标注数据。你可以从Pascal VOC官方网站(http://host.robots.ox.ac.uk/pascal/VOC/voc2012/)下载该数据集。 在网站上,你可以找到Pascal VOC 2012数据集的图片、标注和其他相关文件的下载链接。你需要先注册一个账户,然后接受用户协议,才能开始下载数据集。下载完成后,你可以使用各种计算机视觉工具和库来处理和分析这些图像和标注数据,例如OpenCV、TensorFlow和PyTorch等。 ### 回答2: Pascal VOC2012数据集是计算机视觉领域中非常著名的数据集。该数据集包含了超过11,000张图像,每张图片都以及其对应的对象边框和类别标签。这个数据集是通过对图像进行分类、目标检测、语义分割等任务的评测,成为了视觉任务领域中一个标准的基准数据集。在研究和开发计算机视觉算法和模型时,使用该数据集能够使研究者们更加高效地进行工作。 要下载Pascal VOC2012数据集,可以先访问它的官方网站(http://host.robots.ox.ac.uk/pascal/VOC/)下载对应的图像和标注文件。但是,由于该数据集较大,因此在下载过程中可能会遇到下载速度较慢或下载不完整的问题。因此,研究者们可以从一些国内的镜像站点下载Pascal VOC2012数据集。其中常用的镜像站点包括清华大学镜像站、网易镜像站、中科大镜像站等。 在下载完成之后,我们需要了解如何使用Pascal VOC2012数据集。对于分类任务,我们可以使用图像和其对应的标签进行模型训练。对于目标检测任务,我们需要使用图像的目标边框和类别标签,并且通过目标检测算法对目标进行检测和定位。而对于图像分割任务,则需要使用图像中的像素级别的标注信息,并通过语义分割算法对图像进行分割。 总之,Pascal VOC2012数据集是计算机视觉领域中一个重要的基准数据集,对于提升计算机视觉技术的发展和实践都具有重要的意义。 ### 回答3: Pascal VOC数据集是计算机视觉领域内最著名的数据集之一,包含各种视觉任务,比如目标检测、分类、语义分割等。其中,Pascal VOC2012是该数据集的最新版本,包含了20个物体类别和多个实例级别标注,是做目标检测、图像分割等任务的重要数据源之一。 要下载Pascal VOC2012数据集,首先需要访问Pascal VOC的官网(http://host.robots.ox.ac.uk/pascal/VOC/),然后点击左侧的‘downloads’菜单进入下载页面。在下载页面中,可以找到训练数据集和验证数据集的下载链接,分别是: 1.训练数据集:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar 2.验证数据集:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtest_11-May-2012.tar 需要注意的是,Pascal VOC2012数据集的下载并不是免费的,下载之前需要先申请一个账户并缴纳一些费用,具体费用可以在官网上查询。 下载完成后,可以通过解压缩获得VOCdevkit文件夹,里面包含了训练数据集、验证数据集和标注文件等。其中,训练数据集包含一万多张图片,大约有50万个标注,验证数据集包含2,837张图片,没有标注信息。标注文件中包含了每张图片目标的名称、位置、类别等信息,可以用于训练/测试目标检测、分类、语义分割等模型。 总之,Pascal VOC2012数据集的下载是一个费时费力的过程,但是获得的数据集对于深度学习研究人员和开发者来说是非常重要的。它可以帮助我们训练出更加准确、鲁棒的模型,同时也有助于我们了解计算机视觉领域的最新进展和研究方向。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值