coco2017简介

CoCo2017数据集简介

1. coco2017数据下载及解压

     下载参考: 主:https://blog.csdn.net/u014734886/article/details/78830713                         ###########

                      辅:https://blog.csdn.net/qq_41847324/article/details/86224628

                   实例:https://blog.csdn.net/m0_37644085/article/details/81948396                    ############ 

coco2017包含以下几个文件就好:

coco数据集一共有五种标注类型,分别:目标检测, 关键点检测,素材分割, 全景分割, 图像说明等5种类型;标注信息使用 JSON 格式存储( annotations ), 预处理通过COCO API用于访问和操作所有“标注”

reference: https://blog.csdn.net/u013832707/article/details/93710810

a. 对stuff任务:118282(118K)训练,5k验证

b. 对instance任务:118k训练,instances_minival2014.json(5k)测试

c. 全景分割任务:40890(40k)训练,5k测试

note: 常用2017 Train images [118K / 18G],2017 Val image [5K / 1G]

这些图片对应的标注信息应用: 2017 Train/Val annotations [241MB]

          instances: 目标检测

          captions: 图像描述

          person_keypoints: 人关键点检测

2017 Stuff  Train/Val annotations [1.1GB]  :   素材分割( Stuff Segmentation )

2017 Panoptic Train / Val annotations [821MB] : 全景分割( Panoptic Segmentation )

还有测试集2017 Test images [ 41K/6GB ],这部分数据不知道annotations,分为test-dev集和test集,相当于A,B榜,前者可以提交到evaluation server去查看结果并得到反馈,后者用于评判最终的比赛结果。

2. 标注信息( annotations )数据格式---所有“标注”都具有一下相同的基本数据结构:

coco有5种类型标注,分别是:物体检测,关键点检测,实例分割,全景分割,图片标注,每一个标注都对应一个json文件;json是一个大字典,都包括如下关键字:

{
    “info” : info,
    "images" : [image],
    "annotations" : [annotation],
    "licenses" : [license],
}

其中info对应的内容如下:

info{
    "year" : int,
    "version" : str,
    "description" : str,
    "contributor" : str,
    "url" : str,
    "date_created" : datetime,
}

其中images对应一个list,对应多张图片;list的每一元素是一个字典,对应一张图片,格式如下:

images[
{	
    "id" : int, # 图片id
	"width" : int, # 图片宽
	"height" : int, # 图片高
	"file_name" : str, # 图片名
	"license" : int, 
	"flickr_url" : str, 
	"coco_url" : str, # 图片链接
	"date_captured" : datetime,# 图片标注时间
},
{
    "id" : int, 
	"width" : int, 
	"height" : int, 
	"file_name" : str, 
	"license" : int, 
	"flickr_url" : str, 
	"coco_url" : str, 
	"date_captured" : datetime,
},
...
]

其中 license的内容如下:

license{
    "id" : int,
    "name" : str,
    "url" : str,
}

虽然每个json文件都有"info", “images” , “annotations”, "licenses"关键字,但不同的任务对应的json文件中annotation的形式不同,分别如下:

对木目标检测而言:

每个对象实例的标注都包含一系列字段,包括对象的类别ID(category_id)和分段掩码(segmentation)。 分段格式取决于实例是表示单个对象(iscrowd = 0,在这种情况下使用多边形)还是对象集合(iscrowd = 1,在这种情况下使用RLE)。 请注意,单个对象(iscrowd = 0)可能需要多个多边形,例如,如果被遮挡。 人群注释(iscrowd =

  • 10
    点赞
  • 50
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
coco2017txt标签是指在2017年的COCO数据集上对图像进行标注的文本描述。COCO数据集是一个广泛使用的计算机视觉数据集,包含了大约33万张图像和近50万个标注。这个数据集主要用于图像识别、视觉场景理解、图像生成等任务的研究和评估。 coco2017txt标签是对COCO数据集中每一张图像的文本描述,通常由人工标注者根据图像内容编写。这些标签旨在准确描述图像中的主要内容、对象和场景。例如,对于一张包含狗、人和沙滩的图像,相应的coco2017txt标签可能为“一只狗和一个人在沙滩上玩耍”。 coco2017txt标签的编写是基于对图像内容的观察和理解。标注者通常会根据他们对图像的感知和常识来描述图像中的物体、动作和环境。标签的目的是为了提供给计算机算法和模型更多关于图像内容的信息,以帮助它们进行图像理解、识别和生成等任务。 对于研究者和开发者来说,coco2017txt标签是一个宝贵的资源,它可以被用于训练和测试计算机视觉算法和模型。通过将图像与文本描述关联起来,算法可以学习从图像中提取特征和理解语义。这对于图像分类、目标检测、图像生成等任务来说都是非常有价值的。 总之,coco2017txt标签是COCO数据集中用于对图像进行描述的文本标签。它们提供了对图像内容的语义理解,为计算机视觉算法和模型的研究和应用提供了重要的资源和参考。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值