【数据预处理】CoCo数据集标注文件.json转yolov5标注文件.txt格式

下载pycocotools包(用于解析coco.json文件)
直接运行即可

from pycocotools.coco import COCO
import numpy as np
import tqdm
import argparse


def arg_parser():
    parser = argparse.ArgumentParser('code by rbj')
    parser.add_argument('--annotation_path', type=str,
                        default='D:/project/project-use/yolov5-6.0/utils/annotations_5_custom_classes.json')
    # 生成的txt文件保存的目录
    parser.add_argument('--save_base_path', type=str, default='D:/project/project-use/yolov5-6.0/utils/labels/')
    args = parser.parse_args(args=[])
    # 原网页中是args = parser.parse_args()会报错,改成这个以后解决了
    return args


if __name__ == '__main__':
    args = arg_parser()
    annotation_path = args.annotation_path
    save_base_path = args.save_base_path

    data_source = COCO(annotation_file=annotation_path)
    catIds = data_source.getCatIds()
    categories = data_source.loadCats(catIds)
    categories.sort(key=lambda x: x['id'])
    classes = {}
    coco_labels = {}
    coco_labels_inverse = {}
    count = 0
    for c in categories:
        coco_labels[len(classes)] = c['id']
        coco_labels_inverse[c['id']] = len(classes)
        classes[c['name']] = len(classes)

    img_ids = data_source.getImgIds()
    for index, img_id in tqdm.tqdm(enumerate(img_ids), desc='change .json file to .txt file'):
        img_info = data_source.loadImgs(img_id)[0]
        file_name = img_info['file_name'].split('.')[0]
        height = img_info['height']
        width = img_info['width']

        save_path = save_base_path + file_name + '.txt'
        with open(save_path, mode='w') as fp:
            annotation_id = data_source.getAnnIds(img_id)
            boxes = np.zeros((0, 5))
            if len(annotation_id) == 0:
                fp.write('')
                continue
            annotations = data_source.loadAnns(annotation_id)
            lines = ''
            for annotation in annotations:
                box = annotation['bbox']
                # some annotations have basically no width / height, skip them
                if box[2] < 1 or box[3] < 1:
                    continue
                # top_x,top_y,width,height---->cen_x,cen_y,width,height
                box[0] = round((box[0] + box[2] / 2) / width, 6)
                box[1] = round((box[1] + box[3] / 2) / height, 6)
                box[2] = round(box[2] / width, 6)
                box[3] = round(box[3] / height, 6)
                label = coco_labels_inverse[annotation['category_id']]
                lines = lines + str(label)
                for i in box:
                    lines += ' ' + str(i)
                lines += '\n'
            fp.writelines(lines)
        count = count + 1
        print('succeed {}', count)
    print('finish')

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
coco数据集是一个用于图像识别和物体检测的常用数据集,它包含了大量带有标注的图像。Coco数据集的标注信息以json格式存储,包含了每张图像中物体的位置、类别等信息。 拆分coco数据集的json文件通常有两个常见的需求:按照类别拆分和按照图像拆分。 按照类别拆分json文件可以通过遍历json文件中的每个标注,将同一类别的标注存储到对应的类别文件中。具体步骤如下: 1. 读取coco数据集的json文件,解析出每个标注所对应的图像ID和类别ID。 2. 创建一个字典,以类别ID为键,对应的值为一个列表,用于存储该类别的所有标注。 3. 遍历每个标注,将同一类别的标注添加到对应的列表中。 4. 将每个类别的标注列表保存为单独的json文件。 按照图像拆分json文件可以通过遍历coco数据集中的每个图像,将每个图像的标注信息存储到对应的图像文件中。具体步骤如下: 1. 读取coco数据集的json文件,获取所有图像的列表。 2. 遍历每个图像,获取该图像对应的标注信息。 3. 将每个图像的标注信息保存为单独的json文件。 无论是按照类别拆分还是按照图像拆分,我们都可以使用Python中的json库来进行json文件的读取和写入操作。 拆分coco数据集的json文件可以帮助我们更好地管理和使用数据集的标注信息,方便进行数据预处理、训练模型和评估结果等操作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值