COCO数据集annotations解析以及可视化

针对数据集cocoval2017,解析其annotations文件夹下person_keypoints_val2017.json文件构成以及可视化。

目录

一、person_keypoints_val2017.json的结构分析

1. “info”

2. "licenses"

3. "categories"

4. "images": list of dictionary

5. ”annotations": list o dictionary

二、将整个json文件进行拆分,分出单个图像以及其对应的标注文件以进行后续的可视化

三、json文件可视化

1. 利用COCO API

1.1 加载对应img_id/cat_id的照片并可视化

1.2 加载对应照片的annotation并可视化

1.3 加载对应照片语义分析数据并打印

2. 用openCV可视化


一、person_keypoints_val2017.json的结构分析

根据coco官网给出的data format信息(https://cocodataset.org/#format-data),总体结构如下图所示:

对于任务object detection:若检测到的是单个物体,iscrowd=0,segmentation mask为[polygon]的格式,即多边形顶点的坐标,但由于单个物体可能会被遮挡,有时候需要多个polygon来表示;若检测到是多个物体的集合体(例如一群人),iscrowd=1,则采用RLE编码的格式。categories部分存储了categories_id到categories的mapping。

对于任务keypoints detection,在object detection的基础上增加了keypoints和num_keypoints,每个关键点都有一个可见性标志 v,v=0:未标记(在这种情况下 x=y=0),v=1:标记但不可见,v=2:标记并且可见。skeleton定义了各个关键点之间的连接性。

1. “info”

"info": {
        "description": "COCO 2017 Dataset",
        "url": "http://cocodataset.org",
        "version": "1.0",
        "year": 2017,
        "contributor": "COCO Consortium",
        "date_created": "2017/09/01"
    },

2. "licenses"

"licenses": [
        {
            "url": "http://creativecommons.org/licenses/by-nc-sa/2.0/",
            "id": 1,
            "name": "Attribution-NonCommercial-ShareAlike License"
        },
        {
            "url": "http://creativecommons.org/licenses/by-nc/2.0/",
            "id": 2,
            "name": "Attribution-NonCommercial License"
        },
    # 这里仅列举两个
    ]

3. "categories"

"categories": [
        {
            "supercategory": "person",
            "id": 1,
            "name": "person",
            "keypoints": [
                "nose",
                "left_eye",
                "right_eye",
                "left_ear",
                "right_ear",
                "left_shoulder",
           

  • 4
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
根引用的内容,对于COCO数据集可视化可以分为三部分:标注框bbox的单独可视化、分割标注segmentation的单独可视化以及bbox和segmentation的联合可视化。 对于标注框bbox的单独可视化,可以使用OpenCV或COCO API来实现。使用OpenCV的话,可以读取图像和对应的标注文件,然后利用OpenCV的绘制函数将标注框绘制在图像上。另外,也可以使用COCO API来读取JSON格式的标注文件,然后按照API提供的函数进行可视化。 对于分割标注segmentation的单独可视化,可以使用相似的方法。可以读取图像和对应的标注文件,然后根据标注的分割信息,使用OpenCV或其他图像处理库将分割结果可视化出来。 对于bbox和segmentation的联合可视化,可以将标注框和分割结果叠加在图像上,以更清晰地展示目标物体的位置和形状。 此外,还可以加载对应照片的语义分析数据,并根据需要进行打印或展示。可以使用COCO API加载对应的语义分析数据,并通过调用API提供的函数来展示数据。 综上所述,COCO数据集可视化可以通过加载图像和对应的标注文件,利用OpenCV、COCO API或其他图像处理库来实现标注框和分割结果的可视化,并可以根据需要加载并展示照片的语义分析数据。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [COCO数据集annotations解析以及可视化](https://blog.csdn.net/ZitaoWang/article/details/119824877)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [COCO数据集可视化程序(包括bbox和segmentation)](https://blog.csdn.net/wtandyn/article/details/109751015)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值