Pascal数据集与VOC挑战发展历程介绍 -

Pascal数据集与VOC挑战发展历程介绍

PASCAL数据集:全称:Pattern Analysis,Statistical Modelling and Computational Learing——模式分析,统计建模和计算学习
VOC2012下载地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
VOC2007下载地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar


Pascal数据集主页:http://host.robots.ox.ac.uk/pascal/VOC/
Pascal项目简介
提供用于图像分类的标准数据集
提供通用的连接数据集跟注释的工具集
能实现不同方法之间的评估和对比
运行目标分类的性能评估挑战(从2005到2012年,现在已经完成)


Pascal VOC挑战评估服务器:http://host.robots.ox.ac.uk:8080
需要用机构邮箱注册
评估服务器提交默认是私有的,但可以公开
可以生成匿名URL,生成性能总结条目、


Pascal VOC挑战排行榜:http://host.robots.ox.ac.uk:8080/leaderboard/main_bootstrap.php
提供VOC 2010,2011,2012


Pascal VOC2008-2012总结论文:The PASCAL Visual Object Classes Challenge: A Retrospective
https://download.csdn.net/download/weixin_43912994/11833129


Assessing the Significance of Performance Differences on the PASCAL VOC Challenges via Bootstrapping
z
VOC best practice
VOC鼓励两种类型的参与方式
仅使用提供的训练集与验证集
使用任何的训练集
测试集都只能使用VOC提供的测试集
A brief summary of the main stages of the VOC development


PASCAL数据集从2005-2012年发展改进

**

2005

  • 4类:自行车,汽车,摩托车,人
  • 训练、验证、测试集:1578张图片,包含2209个注释目标 两个比赛:分类与检测 图片取自公共数据集和flickr图片,已经过时

Flickr,雅虎旗下图片分享网站

2006

  • 10类:自行车,公共汽车,小汽车,毛,奶牛,狗,马,摩托车,人类,羊
  • 训练、验证、测试集:2618张图片,包含4757个注释目标
  • 图片来源与flickr与微软剑桥研究院(Microsoft Research Cambridge (MSRC))
  • MSRC的图片比Flickr的图片更容易,因为更加集中与感兴趣的区域,过时

2007

  • 20类:

    • 人:人
    • 动物:鸟,毛,牛,狗,马,羊
    • 交通工具:飞机,自行车,船,公共汽车,小汽车,摩托车,火车
    • 室内物体:瓶子,椅子,餐桌,盆栽植物,沙发,电视\显示器
  • 训练、验证、测试集:9963张图片,包含24640个注释目标 分割任务引进

  • 人体标注任务引进

  • 截断标志(Truncation flag)引入注释

  • 分类挑战的评估方法从 ROC-AUC 改为 AP

  • 固定为20类,

  • 最后一年在测试集中存在注释

2008

  • 20类 数据分为50%的训练与验证集,50%的测试集。
  • 训练验证集:4340张图片包含10363个注释对象 Occlusion
    flag遮挡标志引入注释
    测试数据集注释不再公开
    分割和人体标注数据集来源于VOC2007

2009

  • 20类 训练、验证集:7054张图片,包含17218个ROI注释目标和3211个分割

ROI:region of interest感兴趣区域

  • 从今年起,所有任务数据都由前几年的图像加上新图像组成。这意味这测试结果可以跟之前的结果进行比较 分割从任务升级为标准挑战
  • 增加的图片没有提供困难标志difficult flags(遗漏)

2010

  • 20类 训练验证集:10103张图片,包含23374个ROI注释目标以及4203个分割
  • 动作分类任务引进
  • 引入基于ImageNet的大规模分类挑战 Amazon Mechanical Turk(AMT)被使用与早期的注释工作中

Amazon Mechanical Turk(AMT):亚马逊劳务众包平台

  • 改变了AP的计算方法:使用所用的数据点而不是TREC式采样

2011

  • 20类
  • 训练、验证集:11530张图片,包含27450个ROI注释目标,5034个分割
  • 动作分类扩展为10类+其他
  • 人体布局注释不再完整,有些人备注是,有些没有

2012

  • 20类
  • 训练、验证集:11530张图片,包含27450个ROI目标,6929个分割
  • 分割数据集显著增加
  • 人的动作分类注释使用了额外的身体参考点
  • 用于分类检测和人体布局的数据集与2011的一样。
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值