yolov8特殊xml转txt

xml标注没有高度和宽度信息或者执行python脚本时报错:AttributeError: 'NoneType' object has no attribute 'find'?报这个错误查看xml文件里有没有这个height或者weight

import xml.etree.ElementTree as ET
import os
import cv2
from tqdm import tqdm

classes = ["holothurian", "echinus", "scallop", "starfish"]  # 类别
xml_path = "xml标签文件夹路径"
txt_path = "txt标签存储路径"
image_path = "图像文件夹路径"


# 将原有的xmax,xmin,ymax,ymin换为x,y,w,h
def convert(size, box):
    dw = 1. / size[0]
    dh = 1. / size[1]
    x = (box[0] + box[1]) / 2.0
    y = (box[2] + box[3]) / 2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return (x, y, w, h)


# 输入时图像和图像的宽高
def convert_annotation(image_id, width, hight):
    in_file = open(xml_path + '\\{}.xml'.format(image_id), encoding='UTF-8')
    out_file = open(txt_path + '\\{}.txt'.format(image_id), 'w')  # 生成同名的txt格式文件
    tree = ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')	# 此处是获取原图的宽高,便于后续的归一化操作
    if size is not None:
        w = int(size.find('width').text)
        h = int(size.find('height').text)
    else:
        w = width
        h = hight
        
    for obj in root.iter('object'):
        cls = obj.find('name').text
        # print(cls)
        if cls not in classes:	# 此处会将cls里没有的类别打印,以便后续添加
            print(cls)
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), 
             float(xmlbox.find('xmax').text), 
             float(xmlbox.find('ymin').text),
             float(xmlbox.find('ymax').text))
        bb = convert((w, h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')


# 遍历图片文件将对应的宽高输入convert_annotation,并通过图片名称搜索相对应的xml文件获取label
if __name__  == "__main__":
    img_list = os.listdir(image_path)
    for img in tqdm(img_list):
        label_name = img.split('.')[0]
        print(label_name)
        w, h = cv2.imread(os.path.join(image_path, img)).shape[:2]
        convert_annotation(label_name, w, h)

如果还报错那就是程序文件路径有问题按下面格式改

 

import xml.etree.ElementTree as ET
import os
import cv2
from tqdm import tqdm

classes = ["holothurian", "echinus", "scallop", "starfish"]  # 类别
xml_path = "C:\\Users\\sc\\Desktop\\Mydataset\\data\\Annotations"
txt_path = "C:\\Users\\sc\\Desktop\\Mydataset\\data\\txtlabel"
image_path = "C:\\Users\\sc\\Desktop\\Mydataset\\data\\images"


# 将原有的xmax,xmin,ymax,ymin换为x,y,w,h
def convert(size, box):
    dw = 1. / size[0]
    dh = 1. / size[1]
    x = (box[0] + box[1]) / 2.0
    y = (box[2] + box[3]) / 2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return (x, y, w, h)


# 输入时图像和图像的宽高
def convert_annotation(image_id, width, hight):
    in_file = open(xml_path + '\\{}.xml'.format(image_id), encoding='UTF-8')
    out_file = open(txt_path + '\\{}.txt'.format(image_id), 'w')  # 生成同名的txt格式文件
    tree = ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')  # 此处是获取原图的宽高,便于后续的归一化操作
    if size is not None:
        w = int(size.find('width').text)
        h = int(size.find('height').text)
    else:
        w = width
        h = hight

    for obj in root.iter('object'):
        cls = obj.find('name').text
        # print(cls)
        if cls not in classes:  # 此处会将cls里没有的类别打印,以便后续添加
            print(cls)
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text),
             float(xmlbox.find('xmax').text),
             float(xmlbox.find('ymin').text),
             float(xmlbox.find('ymax').text))
        bb = convert((w, h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')


# 遍历图片文件将对应的宽高输入convert_annotation,并通过图片名称搜索相对应的xml文件获取label
if __name__ == "__main__":
    img_list = os.listdir(image_path)
    for img in tqdm(img_list):
        label_name = img.split('.')[0]
        print(label_name)
        w, h = cv2.imread(os.path.join(image_path, img)).shape[:2]
        convert_annotation(label_name, w, h)

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要将XML格式换为YOLOv5所需的TXT格式,可以使用以下代码进行处理: ```python import os import xml.etree.ElementTree as ET def convert_xml_to_txt(xml_path, txt_path): # 打开XML文件 tree = ET.parse(xml_path) root = tree.getroot() with open(txt_path, 'w') as txt_file: for obj in root.findall('object'): # 获取对象的类别和边界框坐标 name = obj.find('name').text xmin = int(obj.find('bndbox/xmin').text) ymin = int(obj.find('bndbox/ymin').text) xmax = int(obj.find('bndbox/xmax').text) ymax = int(obj.find('bndbox/ymax').text) # 计算中心点坐标和边界框宽高 x_center = (xmin + xmax) / 2 y_center = (ymin + ymax) / 2 width = xmax - xmin height = ymax - ymin # 将数据写入TXT文件 line = f"{name} {x_center} {y_center} {width} {height}" txt_file.write(line + '\n') print(f"Successfully converted {xml_path} to {txt_path}") # 指定XML文件和输出TXT文件的路径 xml_file = 'path/to/input.xml' txt_file = 'path/to/output.txt' # XMLTXT convert_xml_to_txt(xml_file, txt_file) ``` 请将`path/to/input.xml`替换为输入XML文件的路径,将`path/to/output.txt`替换为输出TXT文件的路径。运行该代码后,将会生成对应的TXT文件,其中包含了每个对象的类别和边界框信息,符合YOLOv5的要求。 请注意,此代码仅适用于单个XML文件换。如果需要批量换,请使用适当的循环来处理多个文件。 中提供的XML示例中包含了一个对象的类别和边界框信息。你可以根据自己的XML文件结构进行相应的调整以匹配代码中的解析逻辑。 希望以上信息对你有所帮助!如果有任何进一步的问题,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值