COCO数据集annotations解析以及可视化

最新推荐文章于 2023-12-26 10:57:16 发布

ZitaoWang

最新推荐文章于 2023-12-26 10:57:16 发布

阅读量7.8k

点赞数 4

分类专栏： COCO

本文链接：https://blog.csdn.net/ZitaoWang/article/details/119824877

版权

针对数据集cocoval2017，解析其annotations文件夹下person_keypoints_val2017.json文件构成以及可视化。

一、person_keypoints_val2017.json的结构分析

1. “info”

2. "licenses"

3. "categories"

4. "images": list of dictionary

5. ”annotations": list o dictionary

二、将整个json文件进行拆分，分出单个图像以及其对应的标注文件以进行后续的可视化

三、json文件可视化

1. 利用COCO API

1.1 加载对应img_id/cat_id的照片并可视化

1.2 加载对应照片的annotation并可视化

1.3 加载对应照片语义分析数据并打印

2. 用openCV可视化

一、person_keypoints_val2017.json的结构分析

根据coco官网给出的data format信息（https://cocodataset.org/#format-data），总体结构如下图所示：

对于任务object detection：若检测到的是单个物体，iscrowd=0，segmentation mask为[polygon]的格式，即多边形顶点的坐标，但由于单个物体可能会被遮挡，有时候需要多个polygon来表示；若检测到是多个物体的集合体（例如一群人），iscrowd=1，则采用RLE编码的格式。categories部分存储了categories_id到categories的mapping。

对于任务keypoints detection，在object detection的基础上增加了keypoints和num_keypoints，每个关键点都有一个可见性标志 v，v=0：未标记（在这种情况下 x=y=0），v=1：标记但不可见，v=2：标记并且可见。skeleton定义了各个关键点之间的连接性。

1. “info”

"info": {
"description": "COCO 2017 Dataset",
"url": "http://cocodataset.org",
"version": "1.0",
"year": 2017,
"contributor": "COCO Consortium",
"date_created": "2017/09/01"
},

2. "licenses"

"licenses": [
{
"url": "http://creativecommons.org/licenses/by-nc-sa/2.0/",
"id": 1,
"name": "Attribution-NonCommercial-ShareAlike License"
},
{
"url": "http://creativecommons.org/licenses/by-nc/2.0/",
"id": 2,
"name": "Attribution-NonCommercial License"
},
# 这里仅列举两个
]

最低0.47元/天解锁文章

ZitaoWang

关注

4
点赞
踩
18

收藏

觉得还不错? 一键收藏
4
评论
COCO数据集annotations解析以及可视化

针对数据集cocoval2017，解析其annotations文件夹下person_keypoints_val2017.json文件构成以及可视化。目录一、person_keypoints_val2017.json的结构分析1. “info”：dictionary2."licenses"：list of dictionary3."categories"：list of dictionary4. "images": list of dictionary5. ”annotati...
复制链接

扫一扫