xml格式数据集转yolov5可用的txt

使用方法:

修改input_dir 和 out_dir即可

无需提前知道数据集中含有多少class

转化完成后会在out_dir建立一个classes.txt的文件可以看到labels

import os
import xml.etree.ElementTree as ET


"""
QQ:2509621566
群:949667658
"""

#xml文件存放目录(不要以\结尾)
input_dir = r'C:\Users\25096\Downloads\新建文件夹 (2)\新建文件夹 (2)\labels'

#输出txt文件目录(不要以\结尾)
out_dir = r'C:\Users\25096\Desktop\car\labels'


class_list = []

#获取目录所有xml文件
def file_name(input_dir):
    F = []
    for root, dirs, files in os.walk(input_dir):
        
        for file in files:
            #print file.decode('gbk')    #文件名中有中文字符时转码
            if os.path.splitext(file)[1] == '.xml':
                t = os.path.splitext(file)[0]
                F.append(t) #将所有的文件名添加到L列表中
    return F   # 返回L列表

#获取所有分类
def get_class(filelist):
    for i in filelist:
        f_dir = input_dir+"\\"+i+".xml"
        in_file = open(f_dir,encoding='UTF-8')
        filetree = ET.parse(in_file)
        in_file.close()
        root = filetree.getroot()
        for obj in root.iter('object'):
            difficult = obj.find('difficult').text
            cls = obj.find('name').text
            if cls not in class_list or int(difficult) == 1:
                class_list.append(cls)


def ConverCoordinate(imgshape, bbox):
    # 将xml像素坐标转换为txt归一化后的坐标
    xmin, xmax, ymin, ymax = bbox
    width = imgshape[0]
    height = imgshape[1]
    dw = 1. / width
    dh = 1. / height
    x = (xmin + xmax) / 2.0
    y = (ymin + ymax) / 2.0
    w = xmax - xmin
    h = ymax - ymin

    # 归一化
    x = x * dw
    y = y * dh
    w = w * dw
    h = h * dh

    return x,y,w,h

  
def readxml(i):
    f_dir = input_dir+"\\"+i+".xml"
    
    txtresult = ''
    
    outfile = open(f_dir,encoding='UTF-8')
    filetree = ET.parse(outfile)
    outfile.close()
    root = filetree.getroot()
    
    #获取图片大小
    size = root.find('size')
    width = int(size.find('width').text)
    height = int(size.find('height').text)
    imgshape = (width, height)
    
    #转化为yolov5的格式
    for obj in root.findall('object'):
        # 获取类别名
        obj_name = obj.find('name').text
        
        obj_id = class_list.index(obj_name)
        # 获取每个obj的bbox框的左上和右下坐标
        bbox = obj.find('bndbox')
        xmin = float(bbox.find('xmin').text)
        xmax = float(bbox.find('xmax').text)
        ymin = float(bbox.find('ymin').text)
        ymax = float(bbox.find('ymax').text)
        bbox_coor = (xmin, xmax, ymin, ymax)

        x,y,w,h = ConverCoordinate(imgshape, bbox_coor)
        txt = '{} {} {} {} {}\n'.format(obj_id, x,y,w,h)
        txtresult = txtresult + txt

    #print(txtresult)
    f = open(out_dir+"\\"+i+".txt", 'a')
    f.write(txtresult)
    f.close()
    






    

#获取文件夹下的所有文件
filelist = file_name(input_dir)

#获取所有分类
get_class(filelist)

#打印class
print(class_list)

#xml转txt
for i in filelist:
    readxml(i)


#在out_dir下生成一个class文件
f = open(out_dir+"\\classes.txt", 'a')
classresult = ''
for i in class_list:
    classresult = classresult + i + "\n"
f.write(classresult)
f.close()
    
    


  • 16
    点赞
  • 61
    收藏
    觉得还不错? 一键收藏
  • 15
    评论
评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值