XML编码规则整理，值得收藏

最新推荐文章于 2024-06-05 08:22:28 发布

龙行天下之Sky

最新推荐文章于 2024-06-05 08:22:28 发布

阅读量1.1k

点赞数

分类专栏：学习点滴

本文链接：https://blog.csdn.net/sky101010ws/article/details/43983479

版权

学习点滴专栏收录该内容

75 篇文章 1 订阅

订阅专栏

W3C定义了三条XML解析器如何正确读取XML文件的编码的规则：
1，如果文挡有BOM(字节顺序标记，一般来说，如果保存为unicode格式，则包含BOM，ANSI则无)，就定义了文件编码
2，如果没有BOM，就查看XML声明的编码属性
3，如果上述两个都没有，就假定XML文挡采用UTF-8编码

有了这三条规则，那这个规则就清楚多了。
首先，XML解析器根据文件的BOM来解析文件；如果没找到BOM，由用XML里的encoding属性指定的编码；如果xml里encoding没指定的话，就默认用utf-8来解析文档。然后又可以推出，BOM和ENCODING都有的话，则以BOM指定的为准。

为了避免发生错误，可以在XML文档声明中加上一个encoding属性，指明此XML文档的编码类型，但是不要使用Unicode编码。

在ANSI下，下面的编码类型不会导致错误，并且汉字显示正常:
<?xml version="1.0" encoding="gb2312"?>
<?xml version="1.0" encoding="gbk"?>

下面的编码类型不会导致错误，并且汉字显示不正常(乱码):
<?xml version="1.0" encoding="windows-1252"?>
<?xml version="1.0" encoding="ISO-8859-1"?>
<?xml version="1.0" encoding="UTF-8"?>
<?xml version="1.0" encoding="UTF-16"?>

龙行天下之Sky

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
XML编码规则整理，值得收藏

W3C定义了三条XML解析器如何正确读取XML文件的编码的规则： 1，如果文挡有BOM(字节顺序标记，一般来说，如果保存为unicode格式，则包含BOM，ANSI则无)，就定义了文件编码 2，如果没有BOM，就查看XML声明的编码属性 3，如果上述两个都没有，就假定XML文挡采用UTF-8编码有了这三条规则，那这个规则就清楚多了。首先，XML解析器根据文件的BOM来解析文
复制链接

扫一扫