1、简介
-
MS COCO :Microsoft Common Objects in Context
-
MS COCO 是一个由微软公司创建的用于图像识别和物体检测的大型数据集。
-
MS COCO 数据集有两个版本:MS COCO 2014 和 MS COCO 2017。 这里我们介绍 2017版本
2017版数据集 是对 2014版数据集 的扩展和更新,2017版 较 2014版 的变化有:- 2017版 和 2014版 使用完全相同的图像
- 2017版 训练集/验证集 的划分是118K/5K,而 2014版 是 83K/41K
- 2017版中用于 检测类任务 / 关键点检测 的注释 和 2014版 是一样的, 但是增加了 40K 张训练图像 (118k 训练集中的子集) 和 所有验证集 的stuff 标注 (后面有介绍 stuff categories)
- 2017年的测试集只有两个部分(开发集/挑战集),而2014版的测试集有四个部分(开发集/标准集/储备集/挑战集)。
- 2017版 发布12万张来自COCO的无标记图像,这些图像遵循与标记图像相同的类分布 ,可用于半监督学习。
官网地址:https://cocodataset.org/
官方论文: https://arxiv.org/pdf/1405.0312.pdf
2、数据集特点
COCO 是一个大规模的、用于 对象检测、分割 和 图像描述的 数据集。它有以下几个特点:
大家主要的疑惑点可能在于 80 object categories
和 91 stuff categories
:
stuff categories
:论文中的描述是: “stuff” categories include materials and objects with no clear boundaries (sky, street, grass),即标注了91类没有明确边界的对象(诸如天空,街道,草地)。80 object categories
和91 stuff categories
的区别:论文中用一段文字来描述了它们的区别,简单来说就是80类是91类的一个子集,去掉了一些难以分类和容易混淆的类别,如果做目标检测,基本只用 object 80类。
(2)80个 类别
3、MS COCO 数据集 支持的计算机视觉任务
4、MS COCO 2017 数据集 下载
目标检测任务、语义分割任务,实例分割任务、图像描述人物、关键点检测任务, 只用到我下面框起来的3个文件: (1) 训练集图像文件、(2) 验证集图像文件、(3) 训练集和验证集标注文件
这里我贴出下载链接
训练集图像 (2017 train):http://images.cocodataset.org/zips/train2017.zip
验证集图像 (2017 val):http://images.cocodataset.org/zips/val2017.zip
训练集标注 (2017 annotations): http://images.cocodataset.org/annotations/annotations_trainval2017.zip
数据下载下来后,是如下的文件结构
5、MS COCO 文件标注格式
以 instances_train2017.json 为例,数据读取进来之后,是一个 dict,包含5个元素:info、licenses、image、annotation、categories
import json
json_path = "COCO2017/annotations/instances_train2017.json"
with open(json_path, 'r') as f:
json_labels = json.load(f)
1)info
2)licenses
3)image
4)annotation
5)categories