这个代码可以跟上一个代码配套使用,在xml文件夹中通过关键字找到所有的标签名并打印,这样如果出现别的标签名就可以用上一个代码进行修改(只要是懒得自己找)
import os
import re
def get_unique_names_from_xml_files(folder_path):
# 创建一个空集合来存储唯一的名称
unique_names = set()
# 遍历文件夹中的所有文件
for file_name in os.listdir(folder_path):
# 检查文件是否为 XML 文件
if file_name.endswith('.xml'):
file_path = os.path.join(folder_path, file_name)
# 打开并读取文件内容
with open(file_path, 'r', encoding='utf-8') as file:
content = file.read()
# 使用正则表达式查找所有 <name>...</name> 匹配项
matches = re.findall(r'<name>(.*?)</name>', content)
# 将找到的名称添加到集合中(自动去重)
unique_names.update(matches)
# 打印所有唯一的名称
for name in unique_names:
print(name)
# 示例用法
folder_path = r"F:\park\Annotations" # 替换为你的 XML 文件夹路径
get_unique_names_from_xml_files(folder_path)
17万+

被折叠的 条评论
为什么被折叠?



