Pascal VOC 数据集介绍

介绍Pascal VOC数据集:

  • Challenge and tasks, 只介绍Detection与Segmentation相关内容。
  • 数据格式
  • 衡量方式
  • voc2007, voc2012

Challenge and tasks

给定自然图片, 从中识别出特定物体。 
待识别的物体有20类:

  • person
  • bird, cat, cow, dog, horse, sheep
  • aeroplane, bicycle, boat, bus, car, motorbike, train
  • bottle, chair, dining table, potted plant, sofa, tv/monitor

有以下几个task: 
* Classification(略过) 
* Detection: 将图片中所有的目标用bounding box(bbox)框出来 
* Segmentation: 将图片中所有的目标分割出来 
* Person Layout(略过)

接下来本文只介绍Detection与Segmentation相关的内容。

Dataset

  • 所有的标注图片都有Detection需要的label, 但只有部分数据有Segmentation Label。
  • VOC2007中包含9963张标注过的图片, 由train/val/test三部分组成, 共标注出24,640个物体。
  • VOC2007的test数据label已经公布, 之后的没有公布(只有图片,没有label)。
  • 对于检测任务,VOC2012的trainval/test包含08-11年的所有对应图片。 trainval有11540张图片共27450个物体。
  • 对于分割任务, VOC2012的trainval包含07-11年的所有对应图片, test只包含08-11。trainval有 2913张图片共6929个物体。

Detection Ground Truth and Evaluation

Ground truth

<annotation>
    <folder>VOC2007</folder>
    <filename>009961.jpg</filename>
    <source>
        <database>The VOC2007 Database</database>
        <annotation>PASCAL VOC2007</annotation>
        <image>flickr</image>
        <flickrid>334575803</flickrid>
    </source>
    <owner>
        <flickrid>dictioncanary</flickrid>
        <name>Lucy</name>
    </owner>
    <size><!--image shape-->
        <width>500</width>
        <height>374</height>
        <depth>3</depth>
    </size>
    <segmented>0</segmented><!--是否有分割label-->
    <object>
        <name>dog</name> <!--类别-->
        <pose>Unspecified</pose><!--物体的姿态-->
        <truncated>0</truncated><!--物体是否被部分遮挡(>15%)-->
        <difficult>0</difficult><!--是否为难以辨识的物体, 主要指要结体背景才能判断出类别的物体。虽有标注, 但一般忽略这类物体-->
        <bndbox><!--bounding box-->
            <xmin>69</xmin>
            <ymin>4</ymin>
            <xmax>392</xmax>
            <ymax>345</ymax>
        </bndbox>
    </object>
</annotation>

Evaluation

提交的结果存储在一个文件中, 每行的格式为:

<image identifier> <confidence> <left> <top> <right> <bottom>
  • 1

例如:

comp3_det_test_car.txt:
000004 0.702732 89 112 516 466
000006 0.870849 373 168 488 229
000006 0.852346 407 157 500 213
000006 0.914587 2 161 55 221
000008 0.532489 175 184 232 201
  • confidence会被用于计算mean average precision(mAP). 简要流程如下, 详细可参考https://sanchom.wordpress.com/tag/average-precision/ 
    • 根据confidence对结果排序,计算top-1, 2, …N对应的precision和recall
    • 将recall划分为n个区间t in [t1, ..., tn]
    • 找出满足recall>=t的最大presicision
    • 最后得到n个最大precision, 求它们的平均值
        aps = []
        for t in np.arange(0., 1.1, 0.1):#将recall分为多个区间
        # 在所有 recall > t对应的precision中找出最大值
            mask = tf.greater_equal(recall, t)
            v = tf.reduce_max(tf.boolean_mask(precision, mask)) 
            aps.append(v / 11.)
        # 得到其平均值
        ap = tf.add_n(aps)
        return ap

代码给出的是voc07的计算方式, voc2010在recall区间区分上有变化: 假如有M个正样例,则将recall划分为[1/M, 1/(M - 1), 1/(M - 2), ... 1]。其余步骤不变。

  • 如输出的bbox与一个ground truth bbox的 IOU大于0.5, 且类别相同,则为True Positive, 否则为False Positive
  • 对于一个ground truth bbox, 只会有一个 true positive, 其余都为false positive.

Segmentation

Ground Truth

分割的label由两部分组成: 
* class segmentation: 标注出每一个像素的类别 
* object segmentation: 标注出每一个像素属于哪一个物体 
这里写图片描述

Evaluation

每类的precision和总体precision.


Reference

Pascal VOC数据集是一个用于目标检测和图像分割任务的公共数据集。它是Pascal VOC Challenge的一部分,该挑战赛于2005年至2012年间举办了8届。数据集包含来自20个不同类别的图像,如人、车辆、动物等。这些图像标注了每个对象的边界框和像素级别的分割掩码。 尽管近期的目标检测和分割模型更倾向于使用MS COCO数据集,但Pascal VOC数据集仍然具有重要性。它被视为目标检测和分割领域的先驱者,尤其是Pascal VOC 2007和Pascal VOC 2012两个年份的数据集,在当前的一些论文中经常被引用和使用。 如果你对Pascal VOC数据集的具体类别和数据分布感兴趣,你可以查看Pascal VOC2007和Pascal VOC2012的数据库统计数据,这些数据提供了每个类别的图像数量和分布信息。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [Pascal VOC数据集PPT](https://download.csdn.net/download/weixin_42105457/11904897)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [目标检测数据集PASCAL VOC简介](https://blog.csdn.net/a8039974/article/details/123326337)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [PASCAL VOC数据集](https://blog.csdn.net/weixin_40511249/article/details/119273208)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值