YOLO格式数据集转为COCO数据集(简单粗暴)

最近需要用的coco格式的数据集,但是在网上找的很多 毕竟麻烦,简单记录一下!

1、调整目录结构(以GC10-DET数据集为例)

YOLO格式数据集目录结构如下:
简单来说就是images文件夹里面有train、val、test三个文件夹都放的图片;
labels文件夹也有train、val、test三个文件夹都放的对应的标注!

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

2、使用代码进行转换!(修改两个路径and换成你自己数据集的类别名称即可)

import os
import json
from PIL import Image
 
# 设置数据集路径
output_dir = "D:\\AAAAA\\GC10_coco"   #修改为YOLO格式的数据集路径;
dataset_path = "D:\\AAAAA\\GC10_yolo"  # 修改你想输出的coco格式数据集路径
images_path = os.path.join(dataset_path, "images")
labels_path = os.path.join(dataset_path, "labels")
 
# 类别映射
categories = [
    {"id": 0, "name": "1_chongkong"},
    {"id": 1, "name": "2_hanfeng"},
    {"id": 2, "name": "3_yueyawan"},
    {"id": 3, "name": "4_shuiban"},
    {"id": 4, "name": "5_youban"},
    {"id": 5, "name": "6_siban"},
    {"id": 6, "name": "7_yiwu"},
    {"id": 7, "name": "8_yahen"},
    {"id": 8, "name": "9_zhehen"},
    {"id": 9, "name": "10_yaozhe"},
    # 添加更多类别
]
 
 
# YOLO格式转COCO格式的函数
def convert_yolo_to_coco(x_center, y_center, width, height, img_width, img_height):
    x_min = (x_center - width / 2) * img_width
    y_min = (y_center - height / 2) * img_height
    width = width * img_width
    height = height * img_height
    return [x_min, y_min, width, height]
 
 
# 初始化COCO数据结构
def init_coco_format():
    return {
        "images": [],
        "annotations": [],
        "categories": categories
    }
 
 
# 处理每个数据集分区
for split in ['train', 'test', 'val']:
    coco_format = init_coco_format()
    annotation_id = 1
 
    for img_name in os.listdir(os.path.join(images_path, split)):
        if img_name.lower().endswith(('.png', '.jpg', '.jpeg')):
            img_path = os.path.join(images_path, split, img_name)
            label_path = os.path.join(labels_path, split, img_name.replace("jpg", "txt"))
 
            img = Image.open(img_path)
            img_width, img_height = img.size
            image_info = {
                "file_name": img_name,
                "id": len(coco_format["images"]) + 1,
                "width": img_width,
                "height": img_height
            }
            coco_format["images"].append(image_info)
 
            if os.path.exists(label_path):
                with open(label_path, "r") as file:
                    for line in file:
                        category_id, x_center, y_center, width, height = map(float, line.split())
                        bbox = convert_yolo_to_coco(x_center, y_center, width, height, img_width, img_height)
                        annotation = {
                            "id": annotation_id,
                            "image_id": image_info["id"],
                            "category_id": int(category_id) + 1,
                            "bbox": bbox,
                            "area": bbox[2] * bbox[3],
                            "iscrowd": 0
                        }
                        coco_format["annotations"].append(annotation)
                        annotation_id += 1
 
    # 为每个分区保存JSON文件
    with open(os.path.join(output_dir, f"{split}_coco_format.json"), "w") as json_file:
        json.dump(coco_format, json_file, indent=4)

3、转化完之后,把图片挪过去就行了

在这里插入图片描述

🎈大功告成,转化工作虽然不是全自动的,但是相对简单轻松!

🤞代码是参考的一篇博客,但是时间长,找不到了该博客的链接了!

要将yolo格式数据集换为coco格式,可以按照以下步骤进行操作: 1. 首先,将yolo的box标签类型(xMin, yMin, xMax, yMax)化为coco标签类型(x, y, width, height)。这可以通过计算中心点坐标和框的宽度和高度来实现。将换后的标签保存为txt文件,并在注释文件中添加一列标签对应的图像名称。 2. 创建coco数据集的总体结构。其中包括info、licenses、categories、images和annotations等部分。 3. 在info部分中,填写数据集的年份、版本、描述、提供者、下载地址和创建日期等信息。 4. 在licenses部分中,填写许可证的id、名称和URL。 5. 在categories部分中,填写每个类别的id、名称和所属大类。 6. 在images部分中,填写每个图像的索引id、宽度、高度、文件名、许可证、Flickr URL、COCO URL和日期等信息。 7. 在annotations部分中,填写每个标注框的索引id、图像索引id、类别id、分割信息(可以是RLE或多边形)、面积、边界框坐标和是否拥挤等信息。 通过按照上述步骤进行处理和填写,就可以将yolo格式数据集换为coco格式。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [yolo格式数据标签coco格式](https://blog.csdn.net/carambola_/article/details/127499615)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [代码实现如何将yolov5数据格式换为coco格式](https://blog.csdn.net/yiqiedouhao11/article/details/127631109)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值