问题描述:
对大量xml标签进行修改floder的名字,以及path路径。例如把1修改为train,把路径修改为当前xml所在位置。
xml格式如下:
代码如下:
#!/usr/bin/python
# -*- coding: UTF-8 -*-
import os
import os.path
from xml.etree.ElementTree import parse, Element
import xml.dom.minidom
def test():
path="E://sxs//xml_test//" #xml文件存放路径
files=os.listdir(path) #得到文件夹下所有文件名称 ,注意这里的文件夹下只是放着xml文件,不用把同名的jpg文件放这里
for xmlFile in files: #遍历文件夹
if not os.path.isdir(xmlFile): #判断是否是文件夹,不是文件夹才打开
print(xmlFile)
pass
path="E://sxs//xml_test//"
newStr=os.path.join(path,xmlFile) #拼接路径
dom=parse(newStr) #读取xml文件
root=dom.getroot()
#修改folder的值
dom.find('folder').text="train"
part=xmlFile[0:7]
part1=part+'.jpg'
newStr1='E:/sxs/xml_test/'+part1
root.find('path').text=newStr1
print('path after change')
#输出为ASCII编码
#dom.write(newStr, xml_declaration=True)
#输出为utf-8编码
dom.write(newStr,encoding="utf-8")
pass
if __name__=='__main__':
test()
修改后的xml文件如下:
注意:这个py文件千万不要命名为xml.py。不然会和xml.etree.ElementTree里的文件命名冲突,导致错误。
参考文章如下:
https://www.jianshu.com/p/cf12bef0872c
https://cloud.tencent.com/developer/article/1347707
感谢以上两位博主的文章。