coco数据集大小分类_COCO数据集的简单介绍

最新推荐文章于 2024-07-05 16:47:00 发布

weixin_39872191

最新推荐文章于 2024-07-05 16:47:00 发布

阅读量1.6k

点赞数

文章标签： coco数据集大小分类

本文链接：https://blog.csdn.net/weixin_39872191/article/details/111889129

版权

本文详细介绍了COCO数据集的结构，包括3种标注类型：目标实例、目标关键点和图像描述。数据集通过JSON文件存储，其中images字段对应图片信息，annotations字段包含边界框信息，categories字段列出了类别。每个JSON文件包含info、licenses、images、annotations和categories字段。此外，还解释了不同类型的标注格式，如Object Keypoint和Image Caption的标注细节。

摘要由CSDN通过智能技术生成

COCO通过大量使用Amazon Mechanical Turk来收集数据。COCO数据集现在有3种标注类型：object instances(目标实例), object keypoints(目标上的关键点), 和image captions(看图说话)，使用JSON文件存储。比如下面就是Gemfield下载的COCO 2017年训练集中的标注文件：

可以看到其中有上面所述的三种类型，每种类型又包含了训练和验证，所以共6个JSON文件。

以instances_train2014.json为例，总体形式如下：

(1)images字段列表元素的长度等同于划入训练集(或者测试集)的图片的数量；

(2)annotations字段列表元素的数量等同于训练集(或者测试集)中bounding box的数量；

(3)categories字段列表元素的数量等同于类别的数量，coco为80(2017年)；

>>> ann_train_file='annotations/instances_train2017.json'

>>> coco_train = COCO(ann_train_file)

loading annotations into memory...

Done (t=19.30s)

creating index...

index created!

>>> len(coco_train.dataset['categories'])

>>> len(coco_train.dataset['images'])

118287

>>> len(coco_train.dataset['annotations'])

860001

>>>

这是用来train的json中保存的东西，首先json保存的是一个大的字典：

info这个key指向的字典是一些基本信息，包括时间，版本，贡献者，网址链接等不重要，可以忽略。

images这个key指向的列表(注意是列表，上面info指向的是字典)是图片信息，列表中的每一个字典下存储一张图片的信息，license、coco_url、data_captured和flickr_url这几个key指向的信息大概了解下就行，在你已经下载到原图jpg文件的情况下，这些信息基本没用。接下来就是比较重要的几个信息了，首先是file_name，指向的是一个字符串，是jpg的文件名；其次是height和wid

最低0.47元/天解锁文章

weixin_39872191

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
coco数据集大小分类_COCO数据集的简单介绍

COCO通过大量使用Amazon Mechanical Turk来收集数据。COCO数据集现在有3种标注类型：object instances(目标实例), object keypoints(目标上的关键点), 和image captions(看图说话)，使用JSON文件存储。比如下面就是Gemfield下载的COCO 2017年训练集中的标注文件：可以看到其中有上面所述的三种类型，每种类型又包含...
复制链接

扫一扫