COCO_01 数据集介绍 COCO目标检测分割数据集格式

LiQiang33

已于 2023-02-08 09:40:32 修改

阅读量2.6k

点赞数 1

分类专栏： DeepLearning 文章标签：目标检测计算机视觉深度学习

于 2023-01-15 17:45:48 首次发布

本文链接：https://blog.csdn.net/qq_44776065/article/details/128695821

版权

DeepLearning 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

文章目录

1 COCO数据集介绍
2 COCO数据集目标检测和分割格式
参考

1 COCO数据集介绍

COCO数据集是常用的目标检测和分割数据集，可以用于分类、目标检测、分割以及人体关键点检测等任务，这里我们重点关注目标检测与分割

其中

目标类别object categories 80个（不包括背景）
物体类别stuff categories91（包括背景，背景也被分为不同的物体类）
情景描述captions per image每张图片5段情景描述
人体关键点people with keypoints25w个人进行关键点标注

**NOTE: **
stuff category与object category的区别：stuff类别中包含没有明确边界的对象，即包括不同背景；也可以说object category 80是stuff category 91的子类

COCO数据集格式官网：https://cocodataset.org/#format-data
Arxiv论文：https://arxiv.org/pdf/1405.0312.pdf

2 COCO数据集目标检测和分割格式

annotation.json文件内容有：info, licenses, images, annotations, categories

制作自己的COCO格式主要内容有：images, annotations, categories

具体细节

2.1 images

images中是一个图片信息列表，列表中每一个元素为数据集中一个图片的基本信息，包括：图片文件的名称、图片的高与宽和图片ID，对应的json格式为：

"images": [
	{
		"file_name": 'P1_1_IMG002_frame021.png'，
		"height": 100,
		"width": 100,
		"id": 1021        // 1021第一个1表示术后
		
	}, ...
]

2.2 categories

categories为类别信息的列表，主要有类别ID和类别名称，其对应的json格式为：


"categories": [
	{
		"di": 2,
		"name": "stent"
	}, ...
]

2.3 annotations

annotations为标注文件的列表，列表中的元素为一个对象的标注注意：一张图片可能有多张标注，因此这里并不是一张图片的标注，一个对象的标注信息包括目标框bbox、目标分割segmentation、目标的面积area、目标类别ID category_id、所属图片的ID image_id以及标注ID，是否为拥挤目标 iscrowd（根据情况设定），其json的格式为：

"Annotations"： [
	{
		"segmentation": [[1.0, 2.0, ...],...],   // polygon多边形  
		"area": 100.1,       // 目标面积  
		"iscrowd": 0,            
		"image_id": 1021,      
		"bbox": [10, 20, 5, 6],      //[x, y, w, h] 左上角xy坐标+宽和高   
		"category_id": 1    // 1是内腔， 2是支架       
		"id":  1,    // 标注的ID，可以是标注顺序生成    

	}, ...
]

NOTE：

分割的格式是一个点的二维数组，一般情况是只有一个数组元素，因为一般目标被标记为一个完整的连通区域；如果有多个，则表示一个目标是分开的；数组中的元素是点坐标，其格式为：[x1, y1, x2, y2, ...]
目标框的格式为x, y. width, height，x, y为图片的左上角坐标
标注通过image_id与原图进行关联，通过category_id与类别进行关联，id为获取一个图片标注提供依据