第2章 XML结构化网络文档
HTML源于SGML(标准通用标记语言),是目前书写网页的标准语言,定义一种独立于设备和系统且人机均可读的信息表示方法。引入它的原因是SGML对于和因特网相关的某些用途过于复杂。为了克服HTML的一些缺陷,另一种SGML应用-XML(可扩展性标记语言)应运而生。
<book>
<title> You </title>
<author> V.Marek </author>
<publisher>Spinger</publisher>
<year>1993</year>
<ISBN>038291384</ISBN>
</book>
在很多领域中,人们已经定义了这种基于XML的应用,比如数学领域(MathML)、生物信息领域(BSML)、人力资源领域(HRML)、天文学领域(AML)、新闻领域(NewsML)和投资领域(IRML)。同样,W3C也在XML上定义了多种语言,比如SVG和SMIL。这种方法也应用于定义RDF。
XML语言
一个XML文档包含一个序言、一系列元素和一个可选的尾注。
结构化
有两种定义XML文档结构的方式:DTD方式和XML Schema方式。
XML文档的寻址和查询
XML查询语言的核心概念是路径表达式,它规定如何在XML文档的树形表示中到达一个节点或一个节点集。
XPath是一种对XML文档的组件(parts)进行寻址的语言,它对XML的树形数据模型进行操作,并具有一种非XML语法。关键概念是路径表达式。XPath的路径表达式可为:绝对的和相对的。
处理