COCO_01 数据集介绍 COCO目标检测分割数据集格式

1 COCO数据集介绍

COCO数据集是常用的目标检测和分割数据集,可以用于分类、目标检测、分割以及人体关键点检测等任务,这里我们重点关注目标检测与分割

其中

  • 目标类别object categories 80个(不包括背景)
  • 物体类别stuff categories91(包括背景,背景也被分为不同的物体类)
  • 情景描述captions per image每张图片5段情景描述
  • 人体关键点people with keypoints25w个人进行关键点标注

**NOTE: **
stuff categoryobject category的区别:stuff类别中包含没有明确边界的对象,即包括不同背景;也可以说object category 80stuff category 91的子类

COCO数据集格式官网:https://cocodataset.org/#format-data
Arxiv论文:https://arxiv.org/pdf/1405.0312.pdf

2 COCO数据集目标检测和分割格式

annotation.json文件内容有:info, licenses, images, annotations, categories

制作自己的COCO格式主要内容有:images, annotations, categories

具体细节

2.1 images

images中是一个图片信息列表,列表中每一个元素为数据集中一个图片的基本信息,包括:图片文件的名称图片的高与宽图片ID, 对应的json格式为:

"images": [
	{
		"file_name": 'P1_1_IMG002_frame021.png'"height": 100,
		"width": 100,
		"id": 1021        // 1021第一个1表示术后
		
	}, ...
]

2.2 categories

categories为类别信息的列表,主要有类别ID类别名称,其对应的json格式为:


"categories": [
	{
		"di": 2,
		"name": "stent"
	}, ...
]

2.3 annotations

annotations为标注文件的列表,列表中的元素为一个对象的标注注意:一张图片可能有多张标注,因此这里并不是一张图片的标注,一个对象的标注信息包括目标框bbox、目标分割segmentation、目标的面积area、目标类别ID category_id、所属图片的ID image_id以及标注ID,是否为拥挤目标 iscrowd(根据情况设定),其json的格式为:

"Annotations"[
	{
		"segmentation": [[1.0, 2.0, ...],...],   // polygon多边形  
		"area": 100.1,       // 目标面积  
		"iscrowd": 0,            
		"image_id": 1021,      
		"bbox": [10, 20, 5, 6],      //[x, y, w, h] 左上角xy坐标+宽和高   
		"category_id": 1    // 1是内腔, 2是支架       
		"id":  1,    // 标注的ID,可以是标注顺序生成    

	}, ...
]

NOTE:

  • 分割的格式是一个点的二维数组,一般情况是只有一个数组元素,因为一般目标被标记为一个完整的连通区域;如果有多个,则表示一个目标是分开的;数组中的元素是点坐标,其格式为:[x1, y1, x2, y2, ...]
  • 目标框的格式为x, y. width, height,x, y为图片的左上角坐标
  • 标注通过image_id与原图进行关联,通过category_id与类别进行关联,id为获取一个图片标注提供依据

参考

COCO数据集介绍:https://blog.csdn.net/qq_37541097/article/details/113247318

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
COCO数据集中进行语义分割数据集增强可以通过以下步骤实现: 1. 首先,使用pycocotools库来解析COCO数据集并获取类别ID和图像ID。可以使用`COCO(annotation_file.json)`来加载COCO注释文件,然后使用`coco.getCatIds()`和`coco.getImgIds()`来获取类别ID和图像ID。\[3\] 2. 接下来,根据需要选择一种数据增强方法。常见的数据增强方法包括图像翻转、旋转、缩放、裁剪等。可以使用图像处理库(如OpenCV或PIL)来实现这些操作。 3. 对于语义分割任务,还需要对标注的语义分割掩码进行相应的增强。可以使用`pycocotools`提供的API来读取和处理掩码。具体步骤如下: - 使用`coco.loadImgs(imgIds)`加载图像数据。 - 使用`coco.loadAnns(annIds)`加载与图像相关的注释数据。 - 对于每个注释,可以使用`coco.annToMask(ann)`将注释转换为二进制掩码。 - 对掩码进行相应的增强操作,例如翻转、旋转、缩放等。 - 将增强后的掩码保存到相应的文件中。 4. 最后,根据增强后的图像和掩码生成新的COCO格式的语义分割数据集。可以使用`coco.createIndex()`来创建索引,并使用`coco.loadCats(catIds)`加载类别数据。然后,将增强后的图像和掩码与相应的类别和图像ID进行关联,并保存为新的COCO格式的注释文件。 需要注意的是,数据增强的具体方法和步骤可以根据任务需求和个人偏好进行调整和扩展。以上提供的步骤仅为参考,具体实现可能会有所不同。 #### 引用[.reference_title] - *1* [COCO_01 数据集介绍 COCO目标检测分割数据集格式](https://blog.csdn.net/qq_44776065/article/details/128695821)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v4^insert_chatgpt"}} ] [.reference_item] - *2* [COCO数据集解析生成语义分割mask](https://blog.csdn.net/m0_69178850/article/details/126463681)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v4^insert_chatgpt"}} ] [.reference_item] - *3* [COCO数据集格式解析](https://blog.csdn.net/ViatorSun/article/details/124562686)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v4^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值