用python对数据集进行处理。

更改文件夹中所有xml文件的目标类别

遍历指定文件夹中的所有XML文件,然后对每个文件中的元素的子元素进行类别名称的更改。

import os
import xml.etree.ElementTree as ET

def change_xml_class_in_folder(folder_path, new_class_name):
    # 遍历文件夹中的所有文件
    for filename in os.listdir(folder_path):
        if filename.endswith('.xml'):  # 确保处理的是XML文件
            file_path = os.path.join(folder_path, filename)
            
            # 解析XML文件
            tree = ET.parse(file_path)
            root = tree.getroot()

            # 遍历所有的<object>元素
            for obj in root.findall('object'):
                # 更改类别名称
                obj.find('name').text = new_class_name

            # 写入更改后的XML文件
            tree.write(file_path, encoding='utf-8', xml_declaration=True)
            print(f"Updated class in {filename} to {new_class_name}")

# 指定包含XML文件的文件夹路径
folder_path = 'path/to/your/xml/folder'
# 新的类别名称
new_class_name = 'new_category_name'

# 调用函数更改文件夹中所有XML文件的类别
change_xml_class_in_folder(folder_path, new_class_name)
print("XML class change completed.")

提取多个文件夹中的所有xml文件和图片文件,并分别保存到一个新的文件夹中。

import os
import shutil

def extract_files(source_directories, target_dir_xml, target_dir_images):
    # 确保目标文件夹存在
    os.makedirs(target_dir_xml, exist_ok=True)
    os.makedirs(target_dir_images, exist_ok=True)

    # 支持的文件扩展名
    xml_extensions = ('.xml',)
    image_extensions = ('.png', '.jpg', '.jpeg', '.bmp', '.gif')

    # 遍历所有源文件夹
    for source_dir in source_directories:
        # 遍历源文件夹中的所有文件
        for entry in os.listdir(source_dir):
            source_path = os.path.join(source_dir, entry)
            # 检查文件类型并分类保存
            if os.path.isfile(source_path):
                if entry.lower().endswith(xml_extensions):
                    # 复制XML文件
                    shutil.copy(source_path, target_dir_xml)
                    print(f"Copied XML file to {target_dir_xml}")
                elif entry.lower().endswith(image_extensions):
                    # 复制图片文件
                    shutil.copy(source_path, target_dir_images)
                    print(f"Copied image file to {target_dir_images}")

# 源文件夹列表
source_dirs = ['path/to/source/directory1', 'path/to/source/directory2']
# 目标文件夹路径(XML文件)
target_dir_xml = 'path/to/target/xml/directory'
# 目标文件夹路径(图片文件)
target_dir_images = 'path/to/target/images/directory'

# 调用函数
extract_files(source_dirs, target_dir_xml, target_dir_images)
print("Extraction and copy completed.")
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值