coco数据集大小分类_COCO数据集的简单介绍

本文详细介绍了COCO数据集的结构,包括3种标注类型:目标实例、目标关键点和图像描述。数据集通过JSON文件存储,其中images字段对应图片信息,annotations字段包含边界框信息,categories字段列出了类别。每个JSON文件包含info、licenses、images、annotations和categories字段。此外,还解释了不同类型的标注格式,如Object Keypoint和Image Caption的标注细节。
摘要由CSDN通过智能技术生成

COCO通过大量使用Amazon Mechanical Turk来收集数据。COCO数据集现在有3种标注类型:object instances(目标实例), object keypoints(目标上的关键点), 和image captions(看图说话),使用JSON文件存储。比如下面就是Gemfield下载的COCO 2017年训练集中的标注文件:

可以看到其中有上面所述的三种类型,每种类型又包含了训练和验证,所以共6个JSON文件。

以instances_train2014.json为例,总体形式如下:

(1)images字段列表元素的长度等同于划入训练集(或者测试集)的图片的数量;

(2)annotations字段列表元素的数量等同于训练集(或者测试集)中bounding box的数量;

(3)categories字段列表元素的数量等同于类别的数量,coco为80(2017年);

>>> ann_train_file='annotations/instances_train2017.json'

>>> coco_train = COCO(ann_train_file)

loading annotations into memory...

Done (t=19.30s)

creating index...

index created!

>>> len(coco_train.dataset['categories'])

80

>>> len(coco_train.dataset['images'])

118287

>>> len(coco_train.dataset['annotations'])

860001

>>>

这是用来train的json中保存的东西,首先json保存的是一个大的字典:

info这个key指向的字典是一些基本信息,包括时间,版本,贡献者,网址链接等不重要,可以忽略。

images这个key指向的列表(注意是列表,上面info指向的是字典)是图片信息,列表中的每一个字典下存储一张图片的信息,license、coco_url、data_captured和flickr_url这几个key指向的信息大概了解下就行,在你已经下载到原图jpg文件的情况下,这些信息基本没用。接下来就是比较重要的几个信息了,首先是file_name,指向的是一个字符串,是jpg的文件名;其次是height和wid

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值