voc数据集格式_PASCAL VOC数据集标注格式

1. 简介PASCAL VOC-Pattern Analysis Statical Modeling and Computational Learning很多优秀的计算机视觉模型比如分类,定位,检测,分割,动作识别等模型都是基于PASCAL VOC挑战赛及其数据集上推出的,尤其是一些目标检测模型(比如大名鼎鼎的R CNN系列,以及后面的YOLO,SSD等)2. 数据集2.1 数据集分类PASCAL...
摘要由CSDN通过智能技术生成

1f70dd46aedef76c6b818da6128429e1.png

1. 简介

PASCAL VOC-Pattern Analysis Statical Modeling and Computational Learning

很多优秀的计算机视觉模型比如分类,定位,检测,分割,动作识别等模型都是基于PASCAL VOC挑战赛及其数据集上推出的,尤其是一些目标检测模型(比如大名鼎鼎的R CNN系列,以及后面的YOLO,SSD等)

2. 数据集

2.1 数据集分类

PASCAL VOC数据集共有4大类,vehicle ,household, animal, person,20小类,下图中黑色加粗字体所示

数据集主要关注分类和检测任务

03b70d0ea8cc4d2fe3bf5ca73b94c717.png

2.2 数据量

现在研究常用的数据集是VOC2007和VOC2012,VOC07包含9963张图片,总共24640物体,VOC12包含23080张图片,总共54900物体,两者对比如下:

ec832e320e9fbb9af9564aec9d017319.png
黑色字体所示数字是官方给定的,由于VOC2012数据集中 test 部分没有公布,因此红色字体所示数字为估计数据,按照PASCAL 通常的划分方法,即 trainval 与test 各占总数据量的一半

3. 标注信息格式

标注信息,采用xml文件格式组织如下,参考官网标注信息官网

<annotation>
	<folder>VOC2007</folder>
	<filename>000001.jpg</filename>
	<source>
		<database>The VOC2007 Database</database>
		<annotation>PASCAL VOC2007</annotation>
		<image>flickr</image>
		<flickrid>341012865</flickrid>
	</source>
	<owner>
		<flickrid>Fried Camels</flickrid>
		<name>Jinky the Fruit Bat</name>
	</owner>
	<size>
		<width>353</width>
		<height>500</height>
		<depth>3</depth>
	</size>
	&l
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值