Voc格式标签转YOLO格式，xml转txt

最新推荐文章于 2024-08-05 11:19:50 发布

li1784151928

最新推荐文章于 2024-08-05 11:19:50 发布

阅读量443

点赞数 9

分类专栏：目标检测数据预处理文章标签： YOLO xml 图像处理 python

本文链接：https://blog.csdn.net/li1784151928/article/details/135463292

版权

目标检测数据预处理专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文介绍了如何在Python中修改VOC数据集中类名，并设置XML和TXT文件路径。代码展示了如何遍历XML文件，提取目标对象的类别和边界框坐标，然后按VOC格式进行坐标归一化并写入TXT文件。

摘要由CSDN通过智能技术生成

1、修改class_names添加自己的类名

2、设置vocPath，即xml数据文件夹的主目录。

3、设置主目录下的xml文件名（vocPath）和txt文件名（txtPath）。

# 导入必要的库
import os.path
import xml.etree.ElementTree as ET

# 定义类别名称
class_names = ["cat", "dog"]

# 定义VOC数据集的路径
vocPath = r'path/Main'

# 定义XML文件路径和转换后的TXT文件存放路径
xmlPath = vocPath + r'\labels_voc'
txtPath = vocPath + r'\labels_txt'

# 如果输出目录不存在，则创建
if not os.path.exists(txtPath):
    os.makedirs(txtPath)

# 初始化存储文件名的列表
files = []

# 遍历XML文件目录
for root, dirs, files in os.walk(xmlPath):
    None

# 获取文件数量
number = len(files)
print(number)
i = 0

# 遍历文件列表
while i < number:
    # 提取文件名（不含扩展名）
    name = files[i][0:-4]
    xml_name = name + ".xml"
    txt_name = name + ".txt"
    xml_file_name = os.path.join(xmlPath, xml_name)
    txt_file_name = os.path.join(txtPath, txt_name)

    # 打开XML文件并解析
    xml_file = open(xml_file_name, encoding='gb18030', errors='ignore')
    tree = ET.parse(xml_file)
    root = tree.getroot()

    # 获取图像宽度和高度
    w = int(root.find('size').find('width').text)
    h = int(root.find('size').find('height').text)

    # 打开TXT文件以写入转换后的坐标信息
    f_txt = open(txt_file_name, 'w+')
    content = ""

    first = True

    # 遍历XML文件中的目标对象
    for obj in root.iter('object'):
        # 获取目标类别名称
        name = obj.find('name').text
        # 若只有一类 ,即 class_num = 0
        class_num = class_names.index(name)

        # 获取目标边界框坐标
        xmlbox = obj.find('bndbox')
        x1 = int(xmlbox.find('xmin').text)
        x2 = int(xmlbox.find('xmax').text)
        y1 = int(xmlbox.find('ymin').text)
        y2 = int(xmlbox.find('ymax').text)

        # 根据VOC格式，计算归一化坐标并构建每个目标的行信息
        if first:
            content += str(class_num) + " " + \
                       str((x1 + x2) / 2 / w) + " " + str((y1 + y2) / 2 / h) + " " + \
                       str((x2 - x1) / w) + " " + str((y2 - y1) / h)
            first = False
        else:
            content += "\n" + \
                       str(class_num) + " " + \
                       str((x1 + x2) / 2 / w) + " " + str((y1 + y2) / 2 / h) + " " + \
                       str((x2 - x1) / w) + " " + str((y2 - y1) / h)

    # 打印转换后的内容
    print(content)
    # 将内容写入TXT文件
    f_txt.write(content)
    # 关闭文件
    f_txt.close()
    xml_file.close()
    i += 1