公司裏面的系統用到了XML,我暈了好一陣子,不知道怎麽學?在網上泡阿泡,將找到的文章摘抄下來,以供日後琢磨:
什么是名称空间
XML把名称空间定义为包装XML元素在一起供以后重用的方式。为了使用XML文档的名称空间中定义的元素,你必须通过xmlns属性声明你希望采用名称空间。你还必须为该名称空间定义快捷方式的前缀(例如xs:)作为你文档中的根元素,从而使得名称空间在文档中都可用。前缀是用于文档的任何导入名称空间的元素的标识符。这一过程就如同在Visual Basic中给库加索引或者导入模块;C++、Java或者.NET下的名称空间也具有同样的含义。
annotation 它的作用是代表同其父元素有关的文档。annotation可以包含两个子元素之一,或者是documentation或者是appinfo,或者两者都包含进去。前者用于可读的文档,而后者则用来保存供应用程序处理的指令。
什么是类型?
我已经说过了,XML Schema可以让你把XML文档中的元素声明为特定的类型,准许解析器检查文档的内容及其结构。XML Schem定义了两种主要的数据类型:预定义简单类型和复杂类型。这两种数据类型之间的主要区别是复杂类型可以象数据一样包含其他元素而简单类型则只能包含数据。简单类型给予了XML Schema低级类型检查能力,允许你把元素定义为图A中的任何类型之一。
复杂类型由complexType元素定义,它通常至少拥有一个name属性,用在声明其他元素时索引类型,除非它位于某一元素之内(参见下一节)。所有的复杂类型都会包含一个内容定义类型,其主要功能是定义类型能包含的内容模式。
复杂类型 | 定义 |
sequence | 在其定义范围之内的所有元素都必须按顺序出现,范围由minOccurs和 maxOccurs指定。 |
choice | 其范围内有且只有一个元素必须出现。 |
any | 定义的任何元素都必须出现。 |
simpleContent | 这种复杂类型只包含了非嵌套元素。可以通过包含扩展元素的方式扩展先前定义的简单类型。 |
complexContent | 这种复杂类型只能包含其他元素。可以通过包含扩展元素的方式扩展先前定义的复杂类型。 |
attribute | 这种复杂类型只能包含命名属性。 |
一些准许的XML Schema复杂类型
我们示例schema中的第一个complexType元素定义了booktype类型,你能从文档注释元素中看出,该类型给目录中单一的书建模型。Booktype包含一个sequence元素,通过它告诉解析器这种复杂类型的元素必须按照同样准确的顺序包含出现在sequence标签内出现的所有元素。就booktype而言,元素author、title、genre、price和publish_date都必须出现在 booktype元素之内。
Description又是怎么一回事呢?它出现在sequence元素内,有没有这个必要呢?当然没有。description元素有一个minOccurs属性,它定义了复杂类型中元素可以出现的最小次数。在这种情况下,minOccurs的值是零,因此description是一个可选的元素。
author元素也是这样。它有一个maxOccurs属性,但却没有设值,意思是说author元素可以在sequence中出现无限次,显然,一本图书的作者至少有一个但却不一定只有一个。既没有minOccurs也没有maxOccurs属性的元素必须而且仅仅只能在sequence中出现一次,因此,booktype sequence中的所有其他元素都是必要的而且只能出现一次。
在我们的示例catalog schema中定义的第二个同时也是最后一个复杂类型是catalogtype复杂类型。它也是包含一个以上的sequence,你可以从无界的maxOccurs属性看出这一点。
深入解释
看你的背景知识有多少了,本文用到的示例schema的结构对你来说要不本该如何要不只会叫你发昏,对book和catalog元素不采用正规复杂类型声明来定义catalog schema也是可能的,清单C就是这样。注意,清单C中的complexType元素嵌套在了element元素之内,catalog的sequence元素的子元素具有一个ref属性通过它告诉解析器它有一个引用指向先前定义的book元素。
我曾经听到很多人这样问:“很好,如果是这样的话,那么你为什么要采用以上那些费工夫的办法呢?”很简单,我们绕来饶去只是为了说明XML Schema的重要一点:它是可扩展的。通过定义类型的方式你就可以在多个文档中重用它们,甚至还可以用不同的schema对其进行扩展,这就像你在开发应用程序的时候重用或者扩展抽象数据类型或对象是一个道理。