VOC数据集 转 YOLO数据集

该文章提供了一段Python代码,用于将VOC数据集的XML标注文件转换成YOLO数据集所需的TXT格式。代码处理了类名映射,并按YOLO格式要求计算并输出边界框坐标。适用于图像识别模型训练过程中的数据预处理。
摘要由CSDN通过智能技术生成

VOC数据集的格式为 .xml

YOLO数据集的格式为 .txt

此博客讲解 VOC格式 转 YOLO格式

直接复制下列代码即可转换成功,亲测有效。

import os.path
import xml.etree.ElementTree as ET
import os
import random
# class_names = ['palm', 'stone', 'scissor', 'awesome', 'heartB', 'OK', 'ROCK', 'one', 'swear', 'thanks', 'heartA',
#                'heartC', 'good', 'bad', 'pray', 'call', 'take_picture', 'salute']
class_names = ['aeroplane', 'bicycle', 'bird', 'boat', 'bottle', 'bus', 'car', 'cat', 'chair',
               'cow', 'diningtable', 'dog', 'horse', 'motorbike', 'person', 'pottedplant',
               'sheep', 'sofa', 'train', 'tvmonitor']
xmlpath = 'D:/pycharm/PythonProject/datasets/VOC/images/VOCtest_06-Nov-2007/VOCdevkit/VOC2007/Annotations/'  # 原xml路径
txtpath = 'D:/pycharm/PythonProject/datasets/VOC/images/VOCtest_06-Nov-2007/VOCdevkit/VOC2007/labels_copy/'  # 转换后txt文件存放路径
if not os.path.exists(txtpath):
    os.makedirs(txtpath)
files = []

for root, dirs, files in os.walk(xmlpath):
    None

number = len(files)
print(number)
i = 0
while i < number:

    name = files[i][0:-4]
    xml_name = name + ".xml"
    txt_name = name + ".txt"
    xml_file_name = xmlpath + xml_name
    txt_file_name = txtpath + txt_name

    xml_file = open(xml_file_name)
    tree = ET.parse(xml_file)
    root = tree.getroot()
    filename = root.find('filename').text

    image_name = root.find('filename').text
    w = int(root.find('size').find('width').text)
    h = int(root.find('size').find('height').text)

    f_txt = open(txt_file_name, 'w+')
    content = ""

    first = True

    for obj in root.iter('object'):

        name = obj.find('name').text
        class_num = class_names.index(name)

        xmlbox = obj.find('bndbox')

        x1 = int(xmlbox.find('xmin').text)
        x2 = int(xmlbox.find('xmax').text)
        y1 = int(xmlbox.find('ymin').text)
        y2 = int(xmlbox.find('ymax').text)

        if first:
            content += str(class_num) + " " + \
                       str((x1 + x2) / 2 / w) + " " + str((y1 + y2) / 2 / h) + " " + \
                       str((x2 - x1) / w) + " " + str((y2 - y1) / h)
            first = False
        else:
            content += "\n" + \
                       str(class_num) + " " + \
                       str((x1 + x2) / 2 / w) + " " + str((y1 + y2) / 2 / h) + " " + \
                       str((x2 - x1) / w) + " " + str((y2 - y1) / h)

    # print(str(i / (number - 1) * 100) + "%\n")
    print(content)
    f_txt.write(content)
    f_txt.close()
    xml_file.close()
    i += 1

print("done!")

运行上述代码,即可转换成功!如下图所示,直截取了部分。

温馨小提示:代码中的路径记得更改为自己的路径哦!


加油!每天学会一点点!!

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
VOC数据集换为YOLO格式的具体步骤如下: 1. 首先,确保你已经下载了VOC格式数据集,并且了解VOC格式数据集结构和标注方式。 2. 创建一个新的文件夹,用于存放换后的YOLO格式数据集。 3. 遍历VOC数据集中的每个图像文件和相应的标注文件。 4. 对于每个图像文件,读取图像的宽度和高度。 5. 根据YOLO格式的要求,将图像的宽度和高度写入到YOLO格式的标注文件的第一行。 6. 对于每个标注文件,读取其中的每个标注框的类别和边界框的坐标。 7. 将每个边界框的坐标换为相对于图像宽度和高度的比例。 8. 将每个标注框的类别和换后的边界框坐标按照YOLO格式的要求写入到YOLO格式的标注文件。 9. 将换后的YOLO格式的标注文件保存到之前创建的文件夹中。 10. 重复上述步骤,直到遍历完所有的图像文件和标注文件。 请注意,以上步骤中的具体代码实现可以参考引用和引用中提供的代码示例,它们都是用来将VOC数据集换为YOLO格式的工具。同时,关于文件之间的关系以及存放位置的问题,可以参考引用中的相关讲解。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [VOC格式数据集yolo格式数据集的方法](https://blog.csdn.net/qq_40280673/article/details/125179556)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [voc数据集yolo格式](https://download.csdn.net/download/qq_45389690/13712004)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

zmysunshine

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值