xml文件转为txt文件
在python里面建立xml2txt.py
复制下面这段代码
import os
import glob
from xml.etree import ElementTree
# Define a mapping from class names to numerical labels
class_mapping = {'crazing': 0, 'inclusion': 1, 'patches': 2, 'pitted_surface': 3, 'rolled-in_scale': 4,
'scratches': 5}
# Function to get the numerical label for a given class name
def get_class_label(class_name):
return class_mapping.get(class_name, -1)
# 遍历指定文件夹下的所有xml文件
for filename in glob.glob('F:/Engineer2023/各种数据集备份/NEU-DET/train/annatation/*.xml'):
# 获取文件名(不含扩展名)
basename = os.path.splitext(os.path.basename(filename))[0]
# 创建输出文件路径
output_filename = f"F:/Engineer2023/各种数据集备份/NEU-DET/train/txt/{basename}.txt"
# 解析XML文件
tree = ElementTree.parse(filename)
# 获取XML文件的根元素
root = tree.getroot()
# 创建一个空字符串来存储提取的数据
data = ""
# 遍历XML文件的所有子元素
for obj in root.findall('object'):
# 提取对象的类别
class_name = obj.find('name').text
# 获取类别对应的数值标签
class_label = get_class_label(class_name)
# 如果类别存在于映射中,则提取对象的边界框坐标
if class_label != -1:
bbox = obj.find('bndbox')
xmin = int(bbox.find('xmin').text)
ymin = int(bbox.find('ymin').text)
xmax = int(bbox.find('xmax').text)
ymax = int(bbox.find('ymax').text)
# 将提取的数据添加到字符串中
data += f"{class_label} {xmin} {ymin} {xmax} {ymax}\n"
# 将提取的数据写入到输出文件中
with open(output_filename, 'w') as f:
f.write(data)
其中,将F:/Engineer2023/各种数据集备份/NEU-DET/train换成放xml的地址。