Python 将M3FD数据集格式转为YOLO格式

M3FD从VOC格式转YOLO格式的代码

import os
import xml.etree.ElementTree as ET
import time
from shutil import copyfile
from tqdm import tqdm

"""
本代码这里默认是处理的M3FD数据集
将该数据集由VOC格式转换成YOLO格式
同时将文件重命名存储
同时过滤了自己用不到的类别
使用该代码前,建议稍微读一下,清楚代码中的限制,避免不必要的麻烦
"""
classes = ["People", "Car", "Bus", "Motorcycle", "Lamp", "Truck"]

# 将x1, y1, x2, y2转换成yolov5所需要的x, y, w, h格式
def xyxy2xywh(size, box):
    dw = 1. / size[0]
    dh = 1. / size[1]
    x = (box[0] + box[2]) / 2 * dw
    y = (box[1] + box[3]) / 2 * dh
    w = (box[2] - box[0]) * dw
    h = (box[3] - box[1]) * dh
    return (x, y, w, h)         # 返回的都是标准化后的值


def voc2yolo(path):  # 该函数本文件中未用到
    # 可以打印看看该路径是否正确
    print(len(os.listdir(path)))
    # 遍历每一个xml文件
    for file in os.listdir(path):
        # xml文件的完整路径, 注意:因为是路径所以要确保准确,我是直接使用了字符串拼接, 为了保险可以用os.path.join(path, file)
        label_file = path + file
        # 最终要改成的txt格式文件,这里我是放在voc2007/labels/下面
        # 注意: labels文件夹必须存在,没有就先创建,不然会报错
        out_file = open(path.replace('Annotations', 'labels') + file.replace('xml', 'txt'), 'w')
        # print(label_file)

        # 开始解析xml文件
        tree = ET.parse(label_file)
        root = tree.getroot()
        size = root.find('size')            # 图片的shape值
        w = int(size.find('width').text)
        h = int(size.find('height').text)

        for obj in root.iter('object'):
            difficult = obj.find('difficult').text
            cls = obj.find('name').text
            if cls not in classes or int(difficult) == 1:
                continue
            # 将名称转换为id下标
            cls_id = classes.index(cls)
            # 获取整个bounding box框
            bndbox = obj.find('bndbox')
            # xml给出的是x1, y1, x2, y2
            box = [float(bndbox.find('xmin').text), float(bndbox.find('ymin').text), float(bndbox.find('xmax').text),
                float(bndbox.find('ymax').text)]

            # 将x1, y1, x2, y2转换成yolov5所需要的x_center, y_center, w, h格式
            bbox = xyxy2xywh((w, h), box)
            # 写入目标文件中,格式为 id x y w h
            out_file.write(str(cls_id) + " " + " ".join(str(x) for x in bbox) + '\n')

def save_lab(xml_dir, lab_save, save_name):  # 保存标签文件
    # print(label_file)
    # 开始解析xml文件
    tree = ET.parse(xml_dir)
    root = tree.getroot()
    size = root.find('size')            # 图片的shape值
    w = int(size.find('width').text)
    h = int(size.find('height').text)
    save = False
    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        # 将名称转换为id下标
        cls_id = classes.index(cls)
        # 注意这里对标签进行了过滤,因为我只需要person类别,所以其他的类别并不需要保存,同时如果xml中不存在person类别也不需要创建文件
        if cls_id == 0:
            out_file = open(os.path.join(lab_save, save_name + ".txt"), 'w')
            save = True
        else:
            continue
        # 获取整个bounding box框
        bndbox = obj.find('bndbox')
        # xml给出的是x1, y1, x2, y2
        box = [float(bndbox.find('xmin').text), float(bndbox.find('ymin').text), float(bndbox.find('xmax').text),
            float(bndbox.find('ymax').text)]

        # 将x1, y1, x2, y2转换成yolov5所需要的x_center, y_center, w, h格式
        bbox = xyxy2xywh((w, h), box)
        # 写入目标文件中,格式为 id x y w h
        out_file.write(str(cls_id) + " " + " ".join(str(x) for x in bbox) + '\n')
    return save


def save_img(img_dir, img_save, save_name):
     copyfile(img_dir, os.path.join(img_save, save_name + ".png"))



if __name__ == '__main__':
    data_path = '/data/jjg/codes/datasets/M3FD_Detection/'
    ann_path = os.path.join(data_path, "Annotation")
    img_path = os.path.join(data_path, "Ir")
    img_save = "/data/jjg/codes/datasets/M3FD_Detection/images/"
    lab_save = "/data/jjg/codes/datasets/M3FD_Detection/labels/"
    xml_list = os.listdir(ann_path)
    for xml_name in tqdm(xml_list):
        xml_dir = os.path.join(ann_path, xml_name)
        img_dir = os.path.join(img_path, xml_name[0:-4] + ".png")
        save_name = str(round(time.time() * 1000)) + "-m3fd"
        save = save_lab(xml_dir, lab_save, save_name)
        if save:
            save_img(img_dir, img_save, save_name)

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
UAVDT数据集是以XML格式存储的,而Yolo格式是以txt文件存储的。因此,需要将UAVDT数据集中的XML标签转换为Yolo格式的txt文件。以下是将UAVDT数据集标签转为Yolo格式的步骤: 1. 首先需要下载UAVDT数据集,并解压缩。 2. 创建一个Python脚本,用于将XML标签转换为Yolo格式的txt文件。 3. 在脚本中导入必要的库,如xml.etree.ElementTree和os。 4. 使用os.listdir()函数来获取UAVDT数据集中所有的图像文件名,并遍历每个图像文件。 5. 对于每个图像文件,使用xml.etree.ElementTree库中的parse()函数来解析XML标签文件,并获取每个目标的类别、边界框坐标等信息。 6. 将类别转换为数字格式,并计算出中心点坐标和边界框的宽度和高度。 7. 根据Yolo格式的要求,将目标信息存储在一个txt文件中,并将该文件保存在与图像文件同名的文件夹中。 下面是一个简单的Python脚本,用于将UAVDT数据集标签转换为Yolo格式的txt文件: ```python import xml.etree.ElementTree as ET import os def convert_labels(label_dir, image_dir, output_dir): # 获取所有图像文件名 image_files = os.listdir(image_dir) for image_file in image_files: # 获取标签文件名 label_file = image_file.replace('.jpg', '.xml') label_path = os.path.join(label_dir, label_file) # 解析标签文件 tree = ET.parse(label_path) root = tree.getroot() # 遍历每个目标 for obj in root.findall('object'): # 获取类别 class_name = obj.find('name').text if class_name == 'car': class_id = 0 elif class_name == 'bus': class_id = 1 elif class_name == 'truck': class_id = 2 # 获取边界框坐标 bbox = obj.find('bndbox') x_min = float(bbox.find('xmin').text) y_min = float(bbox.find('ymin').text) x_max = float(bbox.find('xmax').text) y_max = float(bbox.find('ymax').text) # 计算中心点坐标和宽度、高度 x = (x_min + x_max) / 2.0 y = (y_min + y_max) / 2.0 w = x_max - x_min h = y_max - y_min # 将目标信息写入txt文件 txt_file = image_file.replace('.jpg', '.txt') txt_path = os.path.join(output_dir, txt_file) with open(txt_path, 'a') as f: f.write(f"{class_id} {x} {y} {w} {h}\n") ``` 在上述脚本中,convert_labels()函数接受三个参数:标签文件夹路径、图像文件夹路径和输出文件夹路径。该函数会将每个图像文件的标签转换为一个txt文件,并将该文件保存在输出文件夹中。其中,类别名称car、bus和truck分别转换为数字0、1和2。如果UAVDT数据集中有其他类别,需要根据实际情况进行修改。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值