VOC2007数据集解析

最新推荐文章于 2024-08-22 00:37:41 发布

GuanghaoChen

最新推荐文章于 2024-08-22 00:37:41 发布

阅读量3.3w

点赞数 11

分类专栏：行人检测

本文链接：https://blog.csdn.net/qq_33297776/article/details/79758342

版权

本文介绍了VOC2007数据集的下载、文件结构及其主要内容，重点关注JPEGImages、Annotations和Imagesets三个文件夹。内容包括图片原始数据、XML标注解析以及如何将自定义数据集转化为VOC格式，涉及标注软件的使用和Imagesets文件的处理。

摘要由CSDN通过智能技术生成

下载

首先从网站上下载VOC2007数据集下载链接

文件结构

概述

下载后的数据文件主要包含以下内容：
这里写图片描述
由于我们是将数据用于检测，因此，我们只关注Annotation，ImageSets和JPEGImages三个文件夹。下面我们逐个分析每一个文件夹下面的内容：

JPEGImages

这个文件夹主要放置数据的原始图片，图片的文件名用00001.jpg进行命名。
这里写图片描述

Annotations

这个文件夹放置的是对每一张图片的标注。标注使用XML文件的格式。XML是标记语言，形如HTML，详细概念参看百度。每一个XML文件对应一张图片的标注结果，我们以上图000005.jpg的标注为例进行说明。

首先该图的内容是这样的：
这里写图片描述
这张图片对应的XML文件(000005.xml)标记结果如下：

<annotation>
    <folder>VOC2007</folder>
    <!--文件名-->
    <filename>000005.jpg</filename>.   
    <!--数据来源-->
    <source>
        <!--数据来源-->
        <database>The VOC2007 Database</database>
        <annotation>PASCAL VOC2007</annotation>
    <!--来源是flickr，一个雅虎的图像分享网站，下面是id，对于我们没有用-->
        <image>flickr</image>
        <flickrid>325991873</flickrid>
    </source>
    <!--图片的所有者，也没有用-->
    <owner>
        <flickrid>archintent louisville</flickrid>
        <name>?</name>
    </owner>
    <!--图像尺寸,宽、高、长-->
    <size>
        <width>500</width>
        <height>375</height>
        <depth>3</depth>
    </size>
    <!--是否用于分割，0表示用于，1表示不用于-->
    <segmented>0</segmented>
    <!--下面是图像中标注的物体,每一个object包含一个标准的物体-->
    <object>
        <!--物体名称，拍摄角度-->
        <name>chair</name>
        <pose>Rear</pose>
        <!--是否被裁减，0表示完整，1表示不完整-->
        <truncated>0</truncated>