XML中文件编码规则

原创 2018年04月17日 09:27:41

W3C定义了三条XML解析器如何正确读取XML文件的编码的规则:

 1,如果文挡有BOM(字节顺序标记,一般来说,如果保存为unicode格式,则包含BOM,ANSI则无),就定义了文件编码
 2,如果没有BOM,就查看XML声明的编码属性
 3,如果上述两个都没有,就假定XML文挡采用UTF-8编码



BOM:byte order mark

BOM设计出来不是用来支持HTML和XML的。要识别文本编码,HTML有charset属性,XML有encoding属性,没必要拉BOM撑场面。

UTF-8 不需要 BOM,尽管 Unicode 标准允许在 UTF-8 中使用 BOM。
所以不含 BOM 的 UTF-8 才是标准形式,在 UTF-8 文件中放置 BOM 主要是微软的习惯(顺便提一下:把带有 BOM 的小端序 UTF-16 称作「Unicode」而又不详细说明,这也是微软的习惯)。
BOM(byte order mark)是为 UTF-16 和 UTF-32 准备的,用于标记字节序(byte order)。微软在 UTF-8 中使用 BOM 是因为这样可以把 UTF-8 和 ASCII 等编码明确区分开,但这样的文件在 Windows 之外的操作系统里会带来问题。

可参考:https://www.zhihu.com/question/20167122


XML编程

在现代的开发之中,XML技术无处不在,在各个开发框架中,也都到处充斥着XML配置文件的身影。本课程将为读者讲解XML的产生背景,并且详细分析了HTML与XML的区别、XML核心语法,重点在于XML的解析技术(DOM、SAX、DOM4J工具),同时讲解了如何在HTML页面利用JavaScript进行DOM解析实现页面动态开发。官方QQ群:612148723。
  • 2016年12月31日 23:18

XML编码规则整理,值得收藏

W3C定义了三条XML解析器如何正确读取XML文件的编码的规则:  1,如果文挡有BOM(字节顺序标记,一般来说,如果保存为unicode格式,则包含BOM,ANSI则无),就定义了文件编码  2...
  • sky101010ws
  • sky101010ws
  • 2015-02-28 11:11:37
  • 516

文件编码转换工具

  • 2017年03月24日 16:06
  • 52KB
  • 下载

xml属性规则的类型

属性名1 类型   默认值 ..... > 类型: 1、CDATA:表示值为字符,默认值表示未赋值是自动给定的值 2(en1|en2。。。):枚举类型,表示只能从给定集合选择对应值 默...
  • dunyanan1
  • dunyanan1
  • 2011-09-20 19:01:27
  • 292

Dom4j读写文件时的编码问题

Dom4j读写文件时的编码问题
  • wuseyukui
  • wuseyukui
  • 2014-05-05 15:40:52
  • 1314

Android — 解决Android反编译XML文件乱码问题

反编译遇到的问题,仅作记录: 准备反编译工具; 将apk后缀改为.zip并解压,发现res文件夹下打开的布局文件乱码; 反编译工具包里有一个AXMLPrinter2.jar可用于将XML变为可读文...
  • Love667767
  • Love667767
  • 2017-05-17 12:55:38
  • 2050

文件编码方式的分析与理解

学习JavaIO的时候遇到编码,感觉一脸蒙B,于是研究了一下编码这个东西,以下是个人的总结,有不足之处请多多指正。 我们都知道计算机存储的最小单位是字节,而一个字节是八位,也就是说一个字节能表示的范...
  • chenjunjun79
  • chenjunjun79
  • 2016-07-10 13:29:38
  • 728

Xml文件约束规则使用详解

在开发Android应用程序的时候,我们经常都会操作一些Xml文件用以构建我们的Android工程。例如:用以规划Android界面的布局文件,Android工程中的AndroidManifest.x...
  • farsight2009
  • farsight2009
  • 2016-11-02 14:02:55
  • 1458

XML文档规则

下面总结几点XML的简单文档规则   1.XML文档有且仅有一个根元素     2.XML的语法是严格区分大小写的     3.如果不需要子内容,那么该XML元素就是一个空元素,写成:  ...
  • ray8567548
  • ray8567548
  • 2013-07-26 15:43:04
  • 955

xml属性规则类型

属性规则: CDATA:表示值为字符,默认值表示未赋值时自动给定的值; (en1|en2…..):枚举类型,表示只能从给定集合选择对应值; ID :表示值为唯一ID; IDREF:参照已存在(...
  • madanling
  • madanling
  • 2011-09-20 20:57:34
  • 869
收藏助手
不良信息举报
您举报文章:XML中文件编码规则
举报原因:
原因补充:

(最多只允许输入30个字)