【数据集研究】MS COCO


1、简介

  • MS COCO :Microsoft Common Objects in Context

  • MS COCO 是一个由微软公司创建的用于图像识别和物体检测的大型数据集。

  • MS COCO 数据集有两个版本:MS COCO 2014 和 MS COCO 2017。 这里我们介绍 2017版本
    2017版数据集 是对 2014版数据集 的扩展和更新,2017版 较 2014版 的变化有:

    • 2017版 和 2014版 使用完全相同的图像
    • 2017版 训练集/验证集 的划分是118K/5K,而 2014版 是 83K/41K
    • 2017版中用于 检测类任务 / 关键点检测 的注释 和 2014版 是一样的, 但是增加了 40K 张训练图像 (118k 训练集中的子集) 和 所有验证集 的stuff 标注 (后面有介绍 stuff categories)
    • 2017年的测试集只有两个部分(开发集/挑战集),而2014版的测试集有四个部分(开发集/标准集/储备集/挑战集)。
    • 2017版 发布12万张来自COCO的无标记图像,这些图像遵循与标记图像相同的类分布 ,可用于半监督学习。

官网地址:https://cocodataset.org/
官方论文: https://arxiv.org/pdf/1405.0312.pdf


2、数据集特点

COCO 是一个大规模的、用于 对象检测、分割 和 图像描述的 数据集。它有以下几个特点:

在这里插入图片描述

大家主要的疑惑点可能在于 80 object categories91 stuff categories

  • stuff categories :论文中的描述是: “stuff” categories include materials and objects with no clear boundaries (sky, street, grass),即标注了91类没有明确边界的对象(诸如天空,街道,草地)。
  • 80 object categories91 stuff categories 的区别:论文中用一段文字来描述了它们的区别,简单来说就是80类是91类的一个子集,去掉了一些难以分类和容易混淆的类别,如果做目标检测,基本只用 object 80类。

(2)80个 类别
在这里插入图片描述


3、MS COCO 数据集 支持的计算机视觉任务

在这里插入图片描述


4、MS COCO 2017 数据集 下载

目标检测任务、语义分割任务,实例分割任务、图像描述人物、关键点检测任务, 只用到我下面框起来的3个文件: (1) 训练集图像文件、(2) 验证集图像文件、(3) 训练集和验证集标注文件
在这里插入图片描述
这里我贴出下载链接
训练集图像 (2017 train):http://images.cocodataset.org/zips/train2017.zip
验证集图像 (2017 val):http://images.cocodataset.org/zips/val2017.zip
训练集标注 (2017 annotations): http://images.cocodataset.org/annotations/annotations_trainval2017.zip

数据下载下来后,是如下的文件结构
在这里插入图片描述


5、MS COCO 文件标注格式

以 instances_train2017.json 为例,数据读取进来之后,是一个 dict,包含5个元素:info、licenses、image、annotation、categories

import json

json_path = "COCO2017/annotations/instances_train2017.json"
with open(json_path, 'r') as f:
    json_labels = json.load(f)

在这里插入图片描述

1)info
在这里插入图片描述

2)licenses
在这里插入图片描述

3)image

在这里插入图片描述

4)annotation
在这里插入图片描述

5)categories
在这里插入图片描述

  • 5
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Enzo 想砸电脑

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值