COCO格式的图像数据可视化

在测试不同的文档布局智能分析模型的过程中,部分模型只保存了coco格式的annotations,而没有将结果数据进行可视化导出,这不方便进一步的结果对比,为了方便结果可视化,整理了一份COCO格式图像数据可视化文件。
该脚本可以实现将coco格式的图像数据在图像上面打标,画出对应的bbox以及标签,并且根据结果score进行选择性呈现,具体代码如下:

#  可视化coco格式json标注中的box label到图片上
import json
import os
import numpy as np
import shutil
import cv2
'''
标签map
'''
map={
0:"_background_",
1:"Text",
2:"Title",
3:"Figure",
4:"Figure caption",
5:"Table",
6:"Table caption",
7:"Header",
8:"Footer",
9:"Reference",
10:"Equation",
}
def select(json_path, outpath, image_path):
    json_file = open(json_path)
    infos = json.load(json_file)
    #print(infos["images"])
    images = infos["images"]
    annos = infos["annotations"]
    assert len(images) == len(images)
    for i in range(len(images)):
        im_id = images[i]["id"]
        im_path = image_path + "/" + images[i]["file_name"]
        img = cv2.imread(im_path)
        for j in range(len(annos)):
            if annos[j]["image_id"] == im_id:
                score=annos[j]["score"]
                if(score>=0.2):
                  x, y, w, h = annos[j]["bbox"]
                  x, y, w, h = int(x), int(y), int(w), int(h)
                  x2, y2 = x + w, y + h
                  object_id = annos[j]["category_id"]
                  label=map.get(object_id)
                  font = cv2.FONT_HERSHEY_SIMPLEX
                  label_size = cv2.getTextSize(label, font, 1, 2)
                  img = cv2.rectangle(img, (x, y), (x2, y2), (255, 0, 0), thickness=2)
                  text_origin = np.array([x, y - label_size[0][1]])
                  img= cv2.rectangle(img, tuple(text_origin), tuple(text_origin + label_size[0]), (255, 0, 0), thickness=2)
                  cv2.putText(img, label, (x, y - 5), font, 1, (255, 0, 0), 2)
                 
                
                
                  img_name = outpath + "/" + images[i]["file_name"]
                  cv2.imwrite(img_name, img)
                # continue
        print(i)

if __name__ == "__main__":
    train_json = r"/mnt/md0/unilm-master/layoutlmv3/examples/object_detection/path/to/data/PubLayNet/publaynet/test.json"
    train_path = r"/mnt/md0/zhangfanhao/unilm-master/layoutlmv3/examples/object_detection/path/to/data/PubLayNet/publaynet/test/"
    visual_output = r"/mnt/md0/unilm-master/layoutlmv3/examples/object_detection/path/to/data/result"
    select(train_json, visual_output, train_path)

通过上述代码,可以将图像数据进行可视化。
由于模型会将所有框图进行标注,这会导致多个框图出现重叠的问题,不方便于可视化展示,使用score进行简单的筛选可以减少框图的重叠。
但是也存在更进一步的优化方案,如使用IOU或者NMS方法进行去除重叠。

根引用的内容,对于COCO数据集的可视化可以分为三部分:标注框bbox的单独可视化、分割标注segmentation的单独可视化以及bbox和segmentation的联合可视化。 对于标注框bbox的单独可视化,可以使用OpenCV或COCO API来实现。使用OpenCV的话,可以读取图像和对应的标注文件,然后利用OpenCV的绘制函数将标注框绘制在图像上。另外,也可以使用COCO API来读取JSON格式的标注文件,然后按照API提供的函数进行可视化。 对于分割标注segmentation的单独可视化,可以使用相似的方法。可以读取图像和对应的标注文件,然后根据标注的分割信息,使用OpenCV或其他图像处理库将分割结果可视化出来。 对于bbox和segmentation的联合可视化,可以将标注框和分割结果叠加在图像上,以更清晰地展示目标物体的位置和形状。 此外,还可以加载对应照片的语义分析数据,并根据需要进行打印或展示。可以使用COCO API加载对应的语义分析数据,并通过调用API提供的函数来展示数据。 综上所述,COCO数据集的可视化可以通过加载图像和对应的标注文件,利用OpenCV、COCO API或其他图像处理库来实现标注框和分割结果的可视化,并可以根据需要加载并展示照片的语义分析数据。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [COCO数据集annotations解析以及可视化](https://blog.csdn.net/ZitaoWang/article/details/119824877)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [COCO数据集可视化程序(包括bbox和segmentation)](https://blog.csdn.net/wtandyn/article/details/109751015)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值