文件格式(即BOM,BOM就是 byte order mark的缩写)
#W3C定义了三条XML解析器如何正确读取XML文件的编码的规则:
1,如果文挡有BOM(字节顺序标记,一般来说,如果保存为unicode格式,则包含BOM,ANSI则无) ,就定义了文件编码;
2,如果没有BOM,就查看XML声明的编码属性;
3,如果上述两个都没有,就假定XML文挡采用UTF-8编码;
#有了这三条规则,那这个规则就清楚多了。
如果没找到BOM,由用XML里的encoding属性指定的编码;
如果xml里encoding没指定的话,就默认用utf-8来解析文档。
然后又可以推出,BOM和ENCODING都有的话,则以BOM指定的为准。
所以为了避免编码乱码
编码属性encoding 与文档的编码Bom保持一致。