目标检测(1)— 数据集介绍

本文主要介绍目标检测领域常用的三个数据集PASCAL VOC、ImageNet、COCO.

1.PASCAL VOC

1.1 数据集简介

PASCAL VOC挑战在2005-2012年之间展开。该数据集包含11530张用来训练和测试的图片,其中标定了27450个感兴趣区域。该数据集在8年之间由原始的4个分类发展至最终的20个分类:

  • 人: 人
  • 动物:鸟、猫、狗、牛、马、羊
  • 运载工具:飞机、自行车、船、巴士、汽车、摩托车、火车、
  • 物品:瓶子、椅子、餐桌、盆栽、沙发、电视机等。

在整个数据集中,平均每张图片有2.4个目标。
在这里插入图片描述

1.2 数据集结构目录

在这里插入图片描述
Annotations:此文件中放置的是图像对应的标注文件,即,xml文件。
ImageSets文件夹中是标注类别的每个文件列表信息,此文件中会有你划分的训练集图片和测试集图片的名称列表。
JPEGImages中存放的是所有的原始图片,为.JPEG格式。
SegmentationCllass存放所有分割图像的标注。
SegmentationObject存放分割图像的标注文件。

2.ImageNet

ImageNet 是一个计算机视觉系统识别项目, 是目前世界上图像识别最大的数据库。

  • ImageNet拥有用于分类、定位和检测任务评估的数据。
  • 与分类数据类似,定位任务有1000个类别。准确率是根据Top 5检测结果计算出来的。
  • 对200个目标的检测问题有470000个图像,平均每个图像有1.1个目标。

3.COCO数据集

MS COCO的全称是Microsoft Common Objects in Context,起源于是微软于2014年出资标注的Microsoft COCO数据集,与ImageNet 竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。在ImageNet竞赛停办后,COCO竞赛就成为是当前目标识别、检测等领域的一个最权威、最重要的标杆,也是目前该领域在国际上唯一能汇集Google、微软、Facebook以及国内外众多顶尖院校和优秀创新企业共同参与的大赛。

  • COCO(Common Objects in Context)数据集包含20万个图像
  • 80个类别中有超过50万个目标标注。它是最广泛公开的目标检测数据库
  • 平均每个图像有7.2个目标
    在这里插入图片描述
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值