YOLO:将xml数据集转换为txt格式的方法

工具:VS Code
在使用YOLO算法时,数据集如果使用的是xml标注文件时,需要将xml格式转换为txt格式,首先需要新建五个文件夹,以及一个transition.py文件,文件夹之间的关系如下图:注意images文件夹里面的test和train文件夹提前放入使用的测试集和训练集图片,indata文件夹要放入所有要转化的xml文件
在这里插入图片描述
下面的代码是我根据其他博主的方法以及自身的情况尝试并且成功的一段代码,这段代码要放在transition.py文件里~

import xml.etree.ElementTree as ET
 
import pickle
import os
from os import listdir , getcwd
from os.path import join
import glob
 
classes = ["car"]#注意:这里要输入自己使用的数据集的类别classes,若有多个,中间用逗号分隔,查找classes的方法可以见我的另一篇博客https://blog.csdn.net/weixin_57425565/article/details/135949087?spm=1001.2014.3001.5501
 
def convert(size, box):
 
    dw = 1.0/size[0]
    dh = 1.0/size[1]
    x = (box[0]+box[1])/2.0
    y = (box[2]+box[3])/2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x*dw
    w = w*dw
    y = y*dh
    h = h*dh
    return (x,y,w,h)
 
def convert_annotation(image_name):
    in_file = open('./indata/'+image_name[:-3]+'xml') #这里输入自己原来的xml文件路径:我是放在了mydata文件夹下面的indata文件夹,用的是相对路径
    out_file = open('./labels/train/'+image_name[:-3]+'txt', 'w') #这里是images文件夹下面的train文件夹中的图片对应的xml文件转换后的txt文件存放路径:我是放在了labels文件夹下面的train文件夹,要转换test文件夹对应的xml文件,这里要将train改成test
    f = open('./indata/'+image_name[:-3]+'xml')
    xml_text = f.read()
    root = ET.fromstring(xml_text)
    f.close()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
 
 
 
 
    for obj in root.iter('object'):
        cls = obj.find('name').text
        if cls not in classes:
            print(cls)
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
             float(xmlbox.find('ymax').text))
        bb = convert((w,h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')
 
wd = getcwd()
 
if __name__ == '__main__':
 
    for image_path in glob.glob("./images/train/*.bmp"): #这里写xml文件对应的图片的路径,这个是转化train文件夹使用的路径,要转换test文件夹对应的xml文件,这里要将train改成test,再次运行即可
        image_name = image_path.split('\\')[-1]
        convert_annotation(image_name)

需要修改的地方我都写在注释里面了,大家看注释里面的修改即可
因为我也是新手,所以写了尽可能详细的傻瓜教程,方便回顾~

参考博主:https://blog.csdn.net/yxl_prm/article/details/119895511

  • 9
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 可以参考下面的代码,它可以帮助你将DOTA数据集转换yolo格式:import cv2 import numpy as np # 读取DOTA数据集 img = cv2.imread('image.png') # 转换YOLO格式 h, w, _ = img.shape boxes = [] for label, fname in labels: xmin, ymin, xmax, ymax = fname xmin = xmin / w xmax = xmax / w ymin = ymin / h ymax = ymax / h boxes.append([label, xmin, ymin, xmax, ymax]) # 将数据写入yolo格式文件 with open('labels.txt', 'w') as f: for box in boxes: f.write(' '.join([str(box[0]), str(box[1]), str(box[2]), str(box[3]), str(box[4])])) f.write('\n') ### 回答2: 要将DOTA数据集转换Yolo格式的Python代码,你需要进行以下步骤: 1. 遍历DOTA数据集中的每个图像,并打开它。 2. 对于每个图像,读取DOTA标注文件,该文件包含了目标的类别和边界框坐标。 3. 将DOTA的坐标格式转换Yolo的坐标格式。DOTA使用(x_min, y_min, x_max, y_max)的格式,而Yolo使用(x, y, width, height)的格式。你可以使用以下公式进行转换: x = (x_min + x_max) / 2 y = (y_min + y_max) / 2 width = x_max - x_min height = y_max - y_min 4. 将转换后的类别标签和边界框坐标写入Yolo格式的标注文件中,每个对象占据一行。Yolo的标注文件格式为:class_index x y width height。 5. 将转换后的图像保存到Yolo格式的图像文件夹中,以相同的文件名命名。 6. 重复以上步骤,直到遍历完整个DOTA数据集。 下面是一个示例代码框架: ```python import os import glob def convert_dota_to_yolo(dota_dataset_path, yolo_dataset_path): # 创建Yolo格式的图像文件夹 os.makedirs(yolo_dataset_path, exist_ok=True) # 遍历DOTA数据集中的每个图像 for dota_image in glob.glob(os.path.join(dota_dataset_path, '*.jpg')): # 打开图像 img = ... # 使用适当的图像处理库打开图像 # 读取DOTA标注文件 dota_annotation = ... # 使用适当的方法读取DOTA标注文件 # 创建Yolo格式的标注文件 yolo_annotation = os.path.join(yolo_dataset_path, os.path.basename(dota_image.replace('.jpg', '.txt'))) with open(yolo_annotation, 'w') as f: # 将DOTA标注转换Yolo格式并写入文件 for annotation in dota_annotation: class_index = ... # 根据类别名称获得类别索引 x = ... y = ... width = ... height = ... annotation_line = f'{class_index} {x} {y} {width} {height}\n' f.write(annotation_line) # 保存Yolo格式的图像 yolo_image_path = os.path.join(yolo_dataset_path, os.path.basename(dota_image)) img.save(yolo_image_path) ``` 请注意,上述代码仅为示例框架,你需要根据实际的DOTA数据集Yolo格式的要求进行适当的调整。 ### 回答3: 将DOTA数据集转换YOLO格式的python代码可以分为以下几个步骤: 1. 导入必要的库 首先,需要导入一些必要的库,例如`os`、`xml.etree.ElementTree`等。 2. 定义类别和标签字典 在YOLO格式中,需要定义一个类别和标签的字典,其中每个类别对应一个唯一的整数。 3. 解析DOTA数据集 使用`xml.etree.ElementTree`库来解析DOTA数据集XML文件,获取目标的类别和边界框信息。 4. 转换YOLO格式 根据YOLO格式的要求,将DOTA数据集的边界框信息转换YOLO格式的边界框坐标。 5. 保存转换后的数据 按照YOLO格式的要求,将转换后的数据保存为文本文件,每行表示一个目标的类别和边界框坐标。 以下是一个示例的python代码: ```python import os import xml.etree.ElementTree as ET # 定义类别和标签字典 class_dict = {'class1': 0, 'class2': 1, 'class3': 2} def convert_dota_to_yolo(dota_path, yolo_path): for filename in os.listdir(dota_path): if filename.endswith('.xml'): tree = ET.parse(os.path.join(dota_path, filename)) root = tree.getroot() with open(os.path.join(yolo_path, filename.split('.')[0] + '.txt'), 'w') as f: for object in root.findall('object'): class_name = object.find('name').text bbox = object.find('bndbox') xmin = int(bbox.find('xmin').text) ymin = int(bbox.find('ymin').text) xmax = int(bbox.find('xmax').text) ymax = int(bbox.find('ymax').text) xcenter = (xmin + xmax) / 2 ycenter = (ymin + ymax) / 2 width = xmax - xmin height = ymax - ymin class_id = class_dict[class_name] f.write(f'{class_id} {xcenter} {ycenter} {width} {height}\n') # 调用函数将DOTA数据集转换YOLO格式 convert_dota_to_yolo('DOTA_dataset_path', 'YOLO_dataset_path') ``` 请注意,上述代码中的`'class1'`,`'class2'`,`'class3'`等表示DOTA数据集的类别名称,需要根据实际情况进行修改。另外,转换后的YOLO格式数据将保存在指定的`yolo_path`路径下。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值