XML（eXtensible Markup Language）即可扩展标记语言

最新推荐文章于 2019-01-29 18:22:33 发布

weixin_33912638

最新推荐文章于 2019-01-29 18:22:33 发布

阅读量185

点赞数

原文链接：http://blog.51cto.com/irinilu/240531

版权

前言

XML（eXtensible Markup Language）即可扩展标记语言，它与HTML一样，都是处于 SGML，标准通用语言。Xml是 Internet环境中跨平台的，依赖于内容的技术，是当前处理结构化文档信息的有力工具。扩展标记语言XML是一种简单的数据存储语言，使用一系列简单的标记描述数据，而这些标记可以用方便的方式建立，虽然XML占用的空间比二进制数据要占用更多的空间，但XML极其简单易于掌握和使用。

历史

XML 是从1996年开始有其雏形，并向 W3C（全球信息网联盟）提案，而在1998二月发布为W3C的标准（XML1.0）。 XML的前身是SGML（The Standard Generalized Markup Language），是自IBM从60年代就开始发展的 GML（Generalized Markup Language）标准化后的名称

简单结构

每个XML文档都由XML序言开始，在前面的代码中的

第一行便是XML序言，<?xml version="1.0"?> 这一行代码会告诉解析器和浏览器，这个文件应该按照前面讨论过的XML规则进行解析。第二行代码 <books> 则是文档元素（document element），它是文件中最外面的标签（我们认为元素（element）是起始标签和结束标签之间的内容）。所有其他的标签必须包含在这个标签之内来组成一个有效的XML文件。XML文件的第二行并不一定要包含文档元素；如果有注释或者其他内容，文档元素可以迟些出现。

第三行代码是注释，你会发现它与HTML中使用的注释风格是一样的。这是XML从SGML中继承的语法元素之一。

页面再往下的一些地方，可以发现 <desc>标签里有一些特殊的语法。<![CDATA[ ]]>代码用于表示无需进行解析的文本，允许诸如大于号和小于号之类的特殊字符包含在文本中，而无需担心破坏XML的语法。文本必须出现在<![CDATA[和]]>之间才能合适地避免被解析。这样的文本称为Character Data Section，简称CData Section。

下面的一行就是在第二本书的定义之前的：

<?page render multiple authors ?>

虽然它看上去很像XML序言，但实际上是一种称为处理指令（processing instruction）的不同类型的语法。处理指令（以下简称PI）的目的是为了给处理页面的程序（例如XML解析器）提供额外的信息。PI通常情况下是没有固定格式的，唯一的要求是紧随第一个问号必须至少有一个字母。在此之后，PI可以包含除了小于号和大于号之外的任何字符串序列。

结构良好的XML文档

如果某个文档符合XML语法规范，那么我们就说这个文档是“结构良好”的文档。使用本书讲到的XMLSpy 2006工具就可以测试某文档是否为结构良好的XML文档。

有效的XML文档

所谓有效的XML文档是指通过了DTD的验证的，具有良好结构的XML文档，在此大家要明白XML文档可分为结构良好的XML文档和有效的XML文档，以及他们之间的关系。即具有结构良好的XML文档并不一定就是有效的XML文档，反之一个有效的XML文档必定是一个结构良好的XML文档。

转载于:https://blog.51cto.com/irinilu/240531

weixin_33912638

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
XML（eXtensible Markup Language）即可扩展标记语言

前言 XML（eXtensible Markup Language）即可扩展标记语言，它与HTML一样，都是处于SGML，标准通用语言。Xml是Internet环境中跨平台的，依赖于内容的技术，是当前处理结构化文档信息的有力工具。扩展标记语言XML是一种简单的数据存储语言，使用一系列简单的标记描述数据，而这些标记可以用方便的方式建立，虽然XML占用的空间比二进制数据要...
复制链接

扫一扫