练习过程中遇到的这个中文乱码问题,解决了。
下图为需要读取的文件ipad_test.xml,编码格式为utf-16
<?xml version="1.0" encoding="UTF-16"?>
读取代码
# -*- coding:utf-8 -*-
from xml.dom import minidom
filename='ipad_test.xml'
doc = minidom.parse(filename).toxml('utf-8')
print(doc)
出错,乱码
查看doc类型
所以源代码中将其编码成为utf-8即可
# -*- coding:utf-8 -*-
from xml.dom import minidom
filename='ipad_test.xml'
doc = minidom.parse(filename).toxml('utf-8')
print(doc)
s = str(doc, encoding='utf-8')
print(s)
中文正常显示,成功了~