xml schema
关键词: xml schema
xml schema的基础知识最好的教材就是w3c的
http://www.w3.org/TR/xmlschema-0
这个网页上讲到的东西如果掌握了,基本上都能够对实际中所有遇到的xmlInstance进行schema约束。
下面说一些理解schema过程中遇到的一些稍微费解的地方:
1。targetNamespace
schema规范中定义了一些基本的数据类型,比如我们经常用到simpleType的string, float, date,,,这些基本类型, 还有complexType的anyType。这些type的namespace都是标准的http://www.w3.org/2001/XMLSchema, 如果想要使用shema的基本类型, 就必须加上这个Namespace, 实际中往往要定义自己的simpleType和complexType, 而为了把自定义的type跟schema类型分开, 使用targetNamespace即可指定自定义的type的namespace, 而targetnamespace的值往往是异于http://www.w3.org/2001/XMLSchema的。
在设计schema的时候,通常都需要引入http://www.w3.org/2001/XMLSchema即shema的标准namespace, 如果需要使用其它已经存在的schema的一些类型, 那么就同样需要引入对应的namespace, 也就是被引入的schema中指定的targetNamespace的值。
2。elementFormDefault
schema中可以定义全局的element, 比如:
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" targetNamespace="http://schema" xmlns:ns="http://schema">
<xs:element name="a" type="ns:c"/>
<xs:complexType name="c">
<xs:sequence>
<xs:element name="d" type="xs:boolean"/>
</xs:sequence>
</xs:complexType>
<xs:schema>
a就是一个全局的elemnt, 还有一些element是定义在complexType里边的,比如
c里边的element d就是一个局部的element.
全局element和局部的element一个很大的不同是:
全局变量a具有namespace "http://schema",而局部变量d的namespace为"".
所以下面的xml instance是错误的,
<a xmlns="http://schema">
<d>true</d>
</a>
而
<a xmlns="http://schema">
<d xmlns="">true</d>
</a>
就是对的。
这一定让很多刚开始学习schema的人感到不知所措。
事实上,实际中我们用得更多的是前面一个xml instance,但是它就是不能通过上面的shema的校验。既然习惯用前一个xml instance, 那么就当然需要修改schema的定义使得校验能够通过。
怎么修改:
两个方法:
1)
<xs:complexType name="c">
<xs:sequence>
<xs:element name="d" type="xs:boolean" form="qualified"/>
</xs:sequence>
</xs:complexType>
在d上加一个form="qualified", 这样d也具有namespace "http://schema"
2)在schema的属性上加上elementFormDefault="qualified"
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" targetNamespace="http://schema" xmlns:ns="http://schema" elementFormDefault="qualified">
3。schema import
现实中会遇到一些比较复杂xml, 比如
<?xml version="1.0" encoding="UTF-8"?>
<a xmlns="http://schema1" xmlns:edi="http://ccc.cc">
<b edi:attr1="123" attr2="1.112">qwe</b>
<edi:a>
<d>false</d>
</edi:a>
</a>
这个xml复杂的地方在于element a的namespace跟它下面的子元素的<edi:a>的namespace不同,element b的attribute中又含有edi:attr1。那么这个xml怎么来用schema来对它进行约束?
答案是,需要用到schema import的功能。
也即需要编写两个schema文件,其中一个用来对element a,b来进行约束,targetNamespace为"http://schema1", 另外一个schema对<edi:a>, <edi:attr1>来进行约束, targetNamespace为"http://ccc.cc", 前面的schema由于需要用到后面的schema, 所以需要将后者import。
schema1.xsd如下:
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema targetNamespace="http://schema1" elementFormDefault="qualified" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:edi="http://ccc.cc" xmlns:schema1="http://schema1">
<xs:import namespace="http://ccc.cc" schemaLocation="edi.xsd"/>
<xs:element name="a">
<xs:complexType>
<xs:sequence>
<xs:element name="b">
<xs:complexType>
<xs:simpleContent>
<xs:extension base="xs:string">
<xs:attribute ref="edi:attr1"/>
<xs:attribute name="attr2" type="xs:float"/>
</xs:extension>
</xs:simpleContent>
</xs:complexType>
</xs:element>
<xs:element ref="edi:a"/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:element name="d" type="xs:boolean"/>
</xs:schema>
edi.xsd如下:
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema targetNamespace="http://ccc.cc" elementFormDefault="qualified" attributeFormDefault="unqualified" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:ns1="http://schema1">
<xs:import namespace="http://schema1" schemaLocation="schema1.xsd"/>
<xs:element name="a">
<xs:complexType>
<xs:sequence>
<xs:element ref="ns1:d"/>
</xs:sequence>
</xs:complexType>
</xs:element>
<xs:attribute name="attr1">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:maxLength value="3"/>
</xs:restriction>
</xs:simpleType>
</xs:attribute>
</xs:schema>
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/xjtuse_mal/archive/2007/08/15/1745709.aspx