【数据集研究】MS COCO

Enzo 想砸电脑

已于 2023-03-30 09:20:42 修改

阅读量1.2k

点赞数 5

文章标签：计算机视觉人工智能深度学习

于 2023-03-29 14:44:37 首次发布

本文链接：https://blog.csdn.net/weixin_37804469/article/details/129800790

版权

数据集研究专栏收录该内容

4 篇文章 0 订阅

订阅专栏

MS COCO 数据集

1、简介
2、数据集特点
3、MS COCO 数据集支持的计算机视觉任务
4、MS COCO 2017 数据集下载
5、MS COCO 文件标注格式

1、简介

MS COCO ：Microsoft Common Objects in Context
MS COCO 是一个由微软公司创建的用于图像识别和物体检测的大型数据集。
MS COCO 数据集有两个版本：MS COCO 2014 和 MS COCO 2017。这里我们介绍 2017版本
2017版数据集是对 2014版数据集的扩展和更新，2017版较 2014版的变化有：
- 2017版和 2014版使用完全相同的图像
- 2017版训练集/验证集的划分是118K/5K，而 2014版是 83K/41K
- 2017版中用于检测类任务 / 关键点检测的注释和 2014版是一样的，但是增加了 40K 张训练图像（118k 训练集中的子集）和所有验证集的stuff 标注（后面有介绍 stuff categories）
- 2017年的测试集只有两个部分(开发集/挑战集)，而2014版的测试集有四个部分(开发集/标准集/储备集/挑战集)。
- 2017版发布12万张来自COCO的无标记图像，这些图像遵循与标记图像相同的类分布，可用于半监督学习。

官网地址：https://cocodataset.org/
官方论文: https://arxiv.org/pdf/1405.0312.pdf

2、数据集特点

COCO 是一个大规模的、用于对象检测、分割和图像描述的数据集。它有以下几个特点:

在这里插入图片描述

大家主要的疑惑点可能在于 80 object categories 和 91 stuff categories ：

stuff categories ：论文中的描述是： “stuff” categories include materials and objects with no clear boundaries (sky, street, grass)，即标注了91类没有明确边界的对象(诸如天空，街道，草地)。
80 object categories 和 91 stuff categories 的区别：论文中用一段文字来描述了它们的区别，简单来说就是80类是91类的一个子集，去掉了一些难以分类和容易混淆的类别，如果做目标检测，基本只用 object 80类。

（2）80个类别
在这里插入图片描述

3、MS COCO 数据集支持的计算机视觉任务

在这里插入图片描述

4、MS COCO 2017 数据集下载

目标检测任务、语义分割任务，实例分割任务、图像描述人物、关键点检测任务，只用到我下面框起来的3个文件： (1) 训练集图像文件、(2) 验证集图像文件、(3) 训练集和验证集标注文件
在这里插入图片描述
这里我贴出下载链接
训练集图像 (2017 train)：http://images.cocodataset.org/zips/train2017.zip
验证集图像 (2017 val)：http://images.cocodataset.org/zips/val2017.zip
训练集标注 (2017 annotations): http://images.cocodataset.org/annotations/annotations_trainval2017.zip

数据下载下来后，是如下的文件结构
在这里插入图片描述

5、MS COCO 文件标注格式

以 instances_train2017.json 为例，数据读取进来之后，是一个 dict，包含5个元素：info、licenses、image、annotation、categories

import json

json_path = "COCO2017/annotations/instances_train2017.json"
with open(json_path, 'r') as f:
    json_labels = json.load(f)

在这里插入图片描述

1）info
在这里插入图片描述

2）licenses
在这里插入图片描述

3）image

在这里插入图片描述

4）annotation
在这里插入图片描述

5）categories
在这里插入图片描述

Enzo 想砸电脑

关注

5
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
【数据集研究】MS COCO

MS COCO 数据集研究
复制链接

扫一扫

专栏目录

【数据集研究】MS COCO

MS COCO 数据集

1、简介

2、数据集特点

3、MS COCO 数据集 支持的计算机视觉任务

4、MS COCO 2017 数据集 下载

5、MS COCO 文件标注格式

“相关推荐”对你有帮助么？

3、MS COCO 数据集支持的计算机视觉任务

4、MS COCO 2017 数据集下载