labelme标注格式的数据集转COCO格式脚本

该脚本提供了一个自定义JSON编码器MyEncoder,处理NumPy数据类型,并实现Labelme JSON到COCO JSON格式的转换。主要通过labelme2coco类完成,包括图像、类别和标注信息的提取,以及转换后的数据保存。适用于将Labelme标注数据整合到COCO数据集框架,便于计算机视觉任务的训练。
摘要由CSDN通过智能技术生成

1. MyEncoder 类
   - 这是一个自定义的 JSON 编码器类,用于处理 NumPy 数据类型。
   - 当将 NumPy 数组或其他 NumPy 数据类型转换为 JSON 格式时,默认的 JSON 编码器无法正确处理。这个自定义的编码器可以解决这个问题。

2. labelme2coco 类
   - 这是执行从 Labelme JSON 格式到 COCO JSON 格式转换的主要类。

  __init__
     - 初始化类实例,传入 Labelme JSON 文件列表和保存 COCO JSON 文件的路径。

    - **data_transfer**:
     - 处理每个 Labelme JSON 文件,提取图像信息、类别信息和标注信息。

   - **image、categorie、annotation**:
     - 分别从 Labelme JSON 文件中提取图像信息、类别信息和标注信息。

   - **getcatid**:
     - 根据标签获取类别 ID。

   - **getbbox、mask2box**:
     - 计算给定点集或掩码的边界框。

   - **polygons_to_mask**:
     - 将多边形转换为掩码。

   - **data2coco**:
     - 将提取的信息组合成 COCO 格式的字典。

   - **save_json**:
     - 将 COCO 格式的字典保存为 JSON 文件。

3. **主代码块**:
   - 从 `D:\\desktop\\2023\\Pigseg\\images` 目录下获取 Labelme JSON 文件列表。
   - 调用 `labelme2coco` 类,将 Labelme JSON 文件转换为 COCO JSON 格式,并保存到 `D:\\desktop\\2023\\Pigseg\\train.json` 路径下。

,这个脚本的主要功能是将 Labelme 标注格式的 JSON 文件转换为 COCO 标注格式的 JSON 文件,以便在 COCO 数据集框架下使用这些标注数据。这种转换对于将Labelme 创建的标注应用于 COCO 数据集相关的计算机视觉任务非常有帮助。
 

如果要分为训练集train、验证集val,按一定的比例如7:3,

我数据集中是一张图片对应一个json文件,则把70%的json文件和图片放到一个文件夹train,把剩下的30%的json文件放到val.下面的脚本文件需要放置对应的路径,记得分别修改路径和对应的train.json和val.json.

脚本运行后则会生成train.json和val.json两个文件夹,这两个文件夹中对应的就是整合的每张图片的大的json文件,之后就可以到coco格式的模型上进行训练,还需要修改部分函数如coco.py,num_classes.py等。

如果数据集图片是png,则修改一下脚本中的相应位置即可。

# coding=gbk
import argparse
import json
import matplotlib.pyplot as plt
import skimage.io as io
import cv2
import labelme.utils as utils
import numpy as np
import glob
import PIL.Image
import os


# import PIL

#
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值