COCO数据集--分割数据定义及标注信心

COCO数据集中图像都是一样的,标注信息annotations的不同,表示不同的任务。分为:

  • instances——实例分割
  • person_keypoints——关键点分割
  • stuff——语义分割
  • captions——图片的配文,是一句话

每个类别分别包含train,val。

做实例分割任务时,使用instance_train201X.json文件作为标签信息。下面详细介绍。

1、annotations中json文件数据类型

{
 "info" : info,
 "images" : [image],
 "annotations" : [annotation],
 "licenses" : [license],
}

info{
"year" : int,
 "version" : str,
 "description" : str,
 "contributor" : str,
 "url" : str,
 "date_created" : datetime,
}

image{
"id" : int,
 "width" : int,
 "height" : int,
 "file_name" : str,
 "license" : int,
 "flickr_url" : str,
 "coco_url" : str,
 "date_captured" : datetime,
}

license{
"id" : int,
 "name" : str,
 "url" : str,
}

2、以instance_train2014.json文件为例解析  Object Instance Annotations

每个实例注释包含一系列字段,包括对象的类别ID和分割掩码(segmentation mask)。分割格式取决于实例是否代表单个对象(iscrowd = 0,在这种情况下使用多边形)或对象集合(iscrowd = 1,在这种情况下使用RLE)。请注意,单个对象(iscrowd = 0)可能需要多个多边形,例如,如果被遮挡。人群注释(Crowd annotations)(iscrowd = 1)用于标记大量对象(例如一群人)。此外,还为每个对象提供了一个封闭的边界框(框坐标是从左上角的图像角度测量的,并且是0索引的)。最后,注解结构的类别字段存储了类别ID到类别和超类别名称的映射。 See also theDetection Challenge.

{
     "info":      #info信息
          {       #数据集信息
                  "description": "COCO 2014 Dataset", # 描述
                  "url": "http://cocodataset.org",  # 链接
                  "version": "1.0", # 版本
                  "year": 2014, # 年份
                  "contributor": "COCO Consortium",  # 贡献者
                  "date_created": "2017/09/01" # 创建日期
         },



      "images":  #图片信息,数组包含了多张图像
      [   {      #每张图像的具体信息
                  "license": 5,
                  "file_name": "COCO_train2014_000000057870.jpg",
                  "coco_url": "http://images.cocodataset.org/train2014/COCO_train2014_000000057870.jpg",
                  "height": 480,
                  "width": 640,
                  "date_captured": "2013-11-14 16:28:13",
                  "flickr_url": "http://farm4.staticflickr.com/3153/2970773875_164f0c0b83_z.jpg",
                  "id": 57870
  
  • 3
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Detectron2框架是一个用于计算机视觉任务的强大框架,它可以用来训练和测试多种视觉任务,包括目标检测、实例分割和全景分割等。如果我们要在Detectron2框架中使用自己的COCO格式的全景分割数据集,我们可以按照以下步骤进行: 1. 数据集准备:首先,我们需要准备自己的全景分割数据集,并且将其转换为COCO格式的标注COCO格式的标注是一种常用的标注格式,它包含了图像路径、图像尺寸、每个目标的类别、边界框和分割掩膜等信息。 2. 注册数据集:接下来,我们需要注册我们的数据集,以便Detectron2框架能够识别和加载我们的数据集。在Detectron2中,我们可以使用`register_coco_instances`函数来注册COCO格式的数据集。我们需要提供数据集的名称、数据集目录、图像和标注文件的路径,以及数据集类别和颜色映射等信息。 3. 数据集预处理:在加载数据集之前,我们可以定义一些数据预处理的操作,例如图像缩放、归一化和随机增强等,以提高训练效果。我们可以使用Detectron2提供的预处理函数或者自定义自己的预处理函数来实现。 4. 模型配置:在使用Detectron2进行训练或测试之前,我们需要配置模型的参数。我们可以指定使用的模型架构、损失函数、学习率等参数,并将其写入一个配置文件中。 5. 模型训练和测试:最后,我们可以使用Detectron2框架提供的API来进行模型的训练和测试。在训练过程中,框架会自动加载我们注册的数据集,并根据配置文件中的参数进行训练;在测试过程中,框架会加载训练好的模型,并对测试集进行预测和评估。 通过以上步骤,我们可以很方便地在Detectron2框架中使用自己的COCO格式的全景分割数据集进行训练和测试。这也是Detectron2框架的一个强大功能,它可以帮助我们快速地构建和训练自定义的计算机视觉模型。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值