xml转txt格式,只需要修改3处即可,需要修改哪里已经标注出来了
import xml.etree.ElementTree as ET
import os
# 定义类别和其对应的标签(按照自己的类别进行修改)
classes = {
'aeroplane': 0,
'bicycle': 1,
'bird': 2,
'boat': 3,
'bottle': 4,
'bus': 5,
'car': 6,
'cat': 7,
'chair': 8,
# ...
}
# 定义输入输出路径(按照自己路径修改)
xml_dir = 'path/to/xml/dir'
output_dir = 'path/to/output/dir'
# 获取所有XML文件路径
xml_files = os.listdir(xml_dir)
xml_files = [f for f in xml_files if f.endswith('.xml')]
# 遍历XML文件并进行转换
for xml_file in xml_files:
# 读取XML文件
tree = ET.parse(os.path.join(xml_dir, xml_file))
root = tree.getroot()
# 获取图像文件名
img_name = root.find('filename').text
# 获取图像的宽度和高度
width = int(root.find('size').find('width').text)
height = int(root.find('size').find('height').text)
# 创建输出文件并写入标注信息(看看自己的数据集是jpg还是png格式,对照修改,保持一致)
with open(os.path.join(output_dir, img_name.replace('jpg', 'txt')), 'w') as f:
for obj in root.findall('object'):
# 获取类别名称
cls_name = obj.find('name').text
if cls_name not in classes:
continue
# 获取类别标签
cls_id = classes[cls_name]
# 获取标注框的坐标
bbox = obj.find('bndbox')
xmin = int(bbox.find('xmin').text)
ymin = int(bbox.find('ymin').text)
xmax = int(bbox.find('xmax').text)
ymax = int(bbox.find('ymax').text)
# 转换为相对坐标
x = (xmin + xmax) / 2 / width
y = (ymin + ymax) / 2 / height
w = (xmax - xmin) / width
h = (ymax - ymin) / height
# 将标注信息写入输出文件
f.write(f'{cls_id} {x:.6f} {y:.6f} {w:.6f} {h:.6f}\n')