自然图像目标检测数据集汇总

本文详细介绍了三个主流的自然图像目标检测数据集——PASCAL VOC、ImageNet和COCO,包括它们的任务、数据集内容、标注情况及评估标准。PASCAL VOC包含20个类别,ImageNet是深度学习图像领域的基准,COCO提供了丰富的类别和详细的实例分割信息。
摘要由CSDN通过智能技术生成

参考  自然图像目标检测数据集汇总 - 云+社区 - 腾讯云

目录

一、PASCAL VOC

1、Challenge and tasks

2、Dataset

3、Detection Ground Truth

4、Evaluation

二、ImageNet

1、ImageNet数据集简介

2、数据集下载

3、包含项目

三、COCO

1、COCO中的类

2、安装COCO api

3、COCO api介绍

4、主要使用方法


一、PASCAL VOC

1、Challenge and tasks

给定自然图片, 从中识别出特定物体。 
待识别的物体有20类:

  • person
  • bird, cat, cow, dog, horse, sheep
  • aeroplane, bicycle, boat, bus, car, motorbike, train 
  • bottle, chair, dining table, potted plant, sofa, tv/monitor


2、Dataset

所有的标注图片都有Detection需要的label, 但只有部分数据有Segmentation Label。
VOC2007中包含9963张标注过的图片, 由train/val/test三部分组成, 共标注出24,640个物体。
VOC2007的test数据label已经公布, 之后的没有公布(只有图片,没有label)。
对于检测任务,VOC2012的trainval/test包含08-11年的所有对应图片。 trainval有11540张图片共27450个物体。
对于分割任务, VOC2012的trainval包含07-11年的所有对应图片, test只包含08-11。trainval有 2913张图片共6929个物体。


3、Detection Ground Truth


Ground truth

<annotation>

<folder>VOC2007</folder>

<filename>009961.jpg</filename>

<source>

<database>The VOC2007 Database</database>

<annotation>PASCAL VOC2007</annotation>

<image>flickr</image>

<flickrid>334575803</flickrid>

</source>

<owner>

<flickrid>dictioncanary</flickrid>

<name>Lucy</name>

</owner>

<size><!--image shape-->

<width>500</width>

<height>374</height>

<depth>3</depth>

</size>

<segmented>0</segmented><!--是否有分割label-->

<object>

<name>dog</name> <!--类别-->

<pose>Unspecified</pose><!--物体的姿态-->

<truncated>0</truncated><!--物体是否被部分遮挡(>15%)-->

<difficult>0</difficult><!--是否为难以辨识的物体, 主要指要结体背景才能判断出类别的物体。虽有标注, 但一般忽略这类物体-->

<bndbox><!--bounding box-->

<xmin>69</xmin>

<ymin>4</ymin>

<xmax>392</xmax>

<ymax>345</ymax>

</bndbox>

</object>

</annotation>

4、Evaluation

提交的结果存储在一个文件中, 每行的格式为:

<image identifier> <confidence> <left> <top> <right> <bottom>

例如:

comp3_det_test_car.txt:

000004 0
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Wanderer001

ROIAlign原理

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值