XML:Extentsible Markup Language(可扩展标记语言)的缩 写,是用来定义其它语言的一种元语言,其前身是SGML(标准通用标记语言)。它没有标签集(tag set),也没有语法规则(grammatical rule),但 是它有句法规则(syntax rule)。任何XML文档对任何类型的应用以及正确 的解析都必须是良构的(well-formed),即每一个打开的标签都必须有匹配的结束标签,不得含有次序颠倒的标签,并且在语句构成上应符合技术规范的要求。 XML文档可以是有效的(valid),但并非一定要求有效。所谓有效文档是指其符合其文档类型定义(DTD)的文档。如果一个文档符合一个模式(schema)的规定 ,那么这个文档是"模式有效的(schema valid)"。
简单地说,你的电脑上安装过了windows media player,使用wmp的时候可以设置windows media player与某些设备同步,比如和光驱同步可以实现自动播放音乐光盘等等。使用设备设置同步的时候,会放置一个名为WMPInfo.xml的文件,以跟踪同步关系。如果删除了该文件,将导致windows media player丢失其与设备的同步关系信息。
xml本身是一种格式规范,是一种包含了数据以及数据说明的文本格式规范。
比如,我们要给对方传输一段数据,数据内容是“too young,too simple,sometimes naive”,要将这段话按照属性拆分为三个数据的话,就是,年龄too young,阅历too simple,结果sometimes naive。
我们都知道程序不像人,可以体会字面意思,并自动拆分出数据,因此,我们需要帮助程序做拆分,因此出现了各种各样的数据格式以及拆分方式。
比如,可以是这样的 数据为“too young,too simple,sometimes naive” 然后按照逗号拆分,第一部分为年龄,第二部分为阅历,第三部分为结果。
也可以是这样的 数据为“too_young**too_simple*sometimes_naive” 从数据开头开始截取前面十一个字符,去掉*号并把下划线替换为空格作为第一部分,再截取接下来的十一个字符同样去掉*并替换下划线为空格作为第二部分,最后把剩下的字符同样去*号体会空格作为第三部分。
这两种方式都可以用来容纳数据并能够被解析,但是不直观,通用性也不好,而且如果出现超过限定字数的字符串就容纳不了,也可能出现数据本身就下划线字符导致需要做转义。
基于这种情况,出现了xml这种数据格式, 上面的数据用XML表示的话 可以是这样<person age="too young" experience="too simple" result="sometimes naive" />
也可以是这样
<person>
<age value="too young" />
<experience value="too simple" />
<result value="sometimes naive" />
</person>
两种方式都是xml,都很直观,附带了对数据的说明,并且具备通用的格式规范可以让程序做解析。
如果用json格式来表示的话,就是下面这样{
"age":"too young",
"experience":"too simple",
"result":"sometimes naive"
}