这个问题困扰我很久啦
首先你要确定不是xml格式原因,然后可以用我的方法解决
我的是因为xml文件中含有非法字符
下面是我的解决方案:
import os
import re
listdir =['D:/test']
for i in listdir:
for root, dirs, files in os.walk(i):
for file in files:
url = str(root) + str("/") + str(file)
print(url)
f = open(url, encoding="utf-8")
text = f.read()
//这行是重点
text = re.sub(u"[\x00-\x08\x0b-\x0c\x0e-\x1f]+", u"", text)
f.close()
with open(url,"w",encoding="utf-8") as f1:
f1.write(text)