XML Schema与DTD比较

一、【引言】

Xml即Extensible Markup Language可扩展标记语言。它是由SGML(Standard Gerneralized Markup language)发展而来的, 允许开发者自定标签,可以将标签和内容有效的分离。在XML技术里,可以编写一个文档来约束XML文档的书写规范,称之为XML约束。本文主要介绍 DTD与Schema两种约束(当然还还有其他的约束方式,如:XDR,SOX,但都用得极少)

二、【DTD (Document Type Definition)】

DTD是一种比较早起的xml约束方式,它也存在很多缺陷,尤其是在表达属性值和元素内容的类型约束上,而后文提到的XML Schema就是为了客服这些问题而诞生的。(但学习、了解DTD还是很有必要的,比如很多框架都还是原用DTD约束方式)
1、DTD的两种约束方式
DTD约束即可以作为一个单独的文件编写,也可以在XML文件内编写。
(1)、在xml文件内编写DTD
Html代码 复制代码
  1. <?xml version="1.0" encoding="UTF-8" standalone="yes"?> 
  2. <!DOCTYPE 书架 [ 
  3. <!ELEMENT 书架 (书+)> 
  4. <!ELEMENT 书 (书名,作者,售价)> 
  5. <!ELEMENT 书名 (#PCDATA)> 
  6. <!ELEMENT 作者 (#PCDATA)> 
  7. <!ELEMENT 售价 (#PCDATA)> 
  8. ]> 
  9. <书架> 
  10. <> 
  11.   <书名>Java就业培训教程</书名> 
  12.   <作者>张孝祥</作者> 
  13.   <售价>39.00元</售价> 
  14. </> 
  15. ... 
  16. </书架> 


(2)、引用DTD约束
XML文件使用 DOCTYPE 声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:

A、当引用的文件在本地时,采用如下方式:

Html代码 复制代码
  1. <!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL"> 
  2.  
  3. 例如: <!DOCTYPE 书架 SYSTEM “book.dtd”> 
B、当引用的文件是一个公共的文件时,采用如下方式:
Html代码 复制代码
  1. <!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL"> 
  2.  
  3. 例如: 
  4. <!DOCTYPE web-app PUBLIC 
  5.     "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" 
  6.     "http://java.sun.com/dtd/web-app_2_3.dtd"> 
2、DTD约束语法细节:
(1)、 DTD的语法细节:元素定义1
在DTD文档中使用ELEMENT声明一个XML元素,语法格式如下所示:
Html代码 复制代码
  1. <!ELEMENT 元素名称元素类型> 
  2. 元素类型可以是元素内容、或类型 
  3. 如为元素内容:则需要使用()括起来,如 
  4. <!ELEMENT 书架 (书名,作者,售价)> 
  5. <!ELEMENT 书名 (#PCDATA)> 
如为元素类型,则直接书写,DTD规范定义了如下几种类型:
EMPTY:用于定义空元素,例如<br/> <hr/>
ANY:表示元素内容为任意类型。
(2)、 DTD的语法细节:元素定义2
元素内容中可以使用如下方式,描述内容的组成关系
用逗号分隔,表示内容的出现顺序必须与声明时一致。<!ELEMENT MYFILE (TITLE,AUTHOR,EMAIL)>
用|分隔,表示任选其一,即多个只能出现一个
< !ELEMENT MYFILE (TITLE|AUTHOR|EMAIL)>
在元素内容中也可以使用+、*、?等符号表示元素出现的次数:
+: 一次或多次 (书+)
?: 0次或一次 (书?)
*: 0次或多次 (书*)

也可使用圆括号( )批量设置,例
< !ELEMENT MYFILE ((TITLE*, AUTHOR?, EMAIL)* | COMMENT)>

(3)、属性定义
xml文档中的标签属性需通过ATTLIST为其设置属性
语法格式:
Html代码 复制代码
  1. <!ATTLIST 元素名 
  2.     属性名1 属性值类型 设置说明 
  3.     属性名2 属性值类型 设置说明 
  4.     …… 
  5. > 
  6. 属性声明举例: 
  7. <!ATTLIST 商品 
  8.     类别 CDATA #REQUIRED 
  9.     颜色 CDATA #IMPLIED 
  10. > 
对应XML文件:
Html代码 复制代码
  1. <商品 类别="服装" 颜色="黄色"></商品> 
  2.     <商品类别="服装"></商品> 
设置说明:
#REQUIRED:必须设置该属性
#IMPLIED:可以设置也可以不设置
#FIXED:说明该属性的取值固定为一个值,在 XML 文件中不能为该属性设置其它值。但需要为该属性提供这个值

直接使用默认值:在 XML 中可以设置该值也可以不设置该属性值。若没设置则使用默认值。
举例:
Html代码 复制代码
  1. <!ATTLIST 页面作者 
  2.     姓名 CDATA #IMPLIED 
  3.     年龄 CDATA #IMPLIED 
  4.     联系信息 CDATA #REQUIRED 
  5.     网站职务 CDATA #FIXED "页面作者" 
  6.     个人爱好 CDATA "上网" 
  7.        > 
(4)常用属性值类型
CDATA:表示属性值为普通文本字符串。
ENUMERATED
ID
ENTITY(实体)

A、属性值类型——ENUMERATED
属性的类型可以是一组取值的列表,在 XML 文件中设置的属性值只能是这个列表中的某个值(枚举)
Html代码 复制代码
  1. <?xml version = "1.0" encoding="GB2312" standalone="yes"?> 
  2. <!DOCTYPE 购物篮 [ 
  3.     <!ELEMENT 肉 EMPTY> 
  4.     <!ATTLIST 肉 品种 ( 鸡肉 | 牛肉 | 猪肉 | 鱼肉 ) "鸡肉"> 
  5. ]> 
  6. <购物篮> 
  7. <肉 品种="鱼肉"/> 
  8. <肉 品种="牛肉"/> 
  9. </> 
  10. </购物篮> 
B、属性值类型——ID
表示属性的设置值为一个唯一值。
ID 属性的值只能由字母,下划线开始,不能出现空白字符
Html代码 复制代码
  1. <?xml version = "1.0" encoding="GB2312" ?> 
  2.     <!DOCTYPE 联系人列表[ 
  3.     <!ELEMENT 联系人列表 ANY> 
  4.     <!ELEMENT 联系人(姓名,EMAIL)> 
  5.     <!ELEMENT 姓名(#PCDATA)> 
  6.     <!ELEMENT EMAIL(#PCDATA)> 
  7.     <!ATTLIST 联系人 编号 ID #REQUIRED> 
  8. ]> 
  9. <联系人列表> 
  10.     <联系人 编号="1"> 
  11.         <姓名>张三</姓名> 
  12.         <EMAIL>zhang@it315.org</EMAIL> 
  13.     </联系人> 
  14.     <联系人 编号="2"> 
  15.         <姓名>李四</姓名> 
  16.         <EMAIL>li@it315.org</EMAIL> 
  17.     </联系人> 
  18. </联系人列表> 
C、实体定义——ENTITY
实体用于为一段内容创建一个别名,以后在XML文档中就可以使用别名引用这段内容了。
在DTD定义中,一条<!ENTITY …>语句用于定义一个实体。
实体可分为两种类型:引用实体和参数实体。
a、实体定义——引用实体
引用实体主要在 XML 文档中被应用
语法格式:
< !ENTITY 实体名称 “实体内容” >:直接转变成实体内容
引用方式:
&实体名称;
举例:
< !ENTITY copyright “I am a programmer">
……
&copyright;
b、实体定义——参数实体
参数实体被 DTD文件自身使用
语法格式:
<!ENTITY % 实体名称 "实体内容" >
引用方式:
%实体名称;
举例1:
Html代码 复制代码
  1. <!ENTITY % TAG_NAMES "姓名 | EMAIL | 电话 | 地址"> 
  2.   
  3.     <!ELEMENT 个人信息 (%TAG_NAMES; | 生日)> 
  4.   <!ELEMENT 客户信息 (%TAG_NAMES; | 公司名)> 
举例2:
Html代码 复制代码
  1. <!ENTITY % common.attributes 
  2.   " id ID #IMPLIED 
  3. account CDATA #REQUIRED " 
  4. > 
  5. ... 
  6. <!ATTLIST purchaseOrder %common.attributes;> 
  7. <!ATTLIST item %common.attributes;> 

三、【XML Schema约束】

Schema与DTD完全不同,DTD使用不同于xml本身的另一套语法,而Schema自身也是一个xml文档,同时,schema对DTD中的不足 进行了不出,尤其是在表达属性值和元素内容的类型约束上(这也刚好是DTD的缺点)。
1、根标记
XML Schema模式是扩展名为“.xsd”的一个文本文件,使用XML语法来编写。 XML Schema模式的跟标记必须是schema,使用的名称空间是:
http://www.w3.org/2001/XMLSchema
名称空间的前缀xsd。例如:
Html代码 复制代码
  1. <xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema"> 
  2.     .... 
  3. </xsd:shema> 
2、元素标记
XML Schema模式的主要目的是约束XML文件中的标记。XML Schema模式用“element”标记来约束XML中的标记。可以将“element”标记作为XML Schema模式中根标记的子标记来使用, XML Schema模式中的“element”标记简称为元素。若元素是根标记的子标记,这样的元素称为全局元素,全局元素的作用是约束XML文件中任何级别上的子标记,而无论该XML标记是XML文件中的哪一级子标记。对于XML文件中没有子标记的标记, XML Schema模式使用“简单类型”元素来约束。 XML Schema模式中的“简单类型”元素的格式为:
Html代码 复制代码
  1. <xsd:element name="标记名称" type="简单数据类型"> 
其中,“标记名称”就是对应的XML文件中标记的名称,“简单数据类型”是对标记中文本数据的限制。例如,如果XML Schema模式有如下的元素:
Html代码 复制代码
  1. <xsd:element name="出生日期" type="xsd:date"> 
那么使用该模式进行约束的XML文件中任何名字为“出生日期”的标记中文本数据必须是日期类型。
XML Schema模式可以使用的简单数据类型有:int、float、double、date、time、string等。
如 :
<xsd:element name="出生日期" type="xsd:date">
元素约束XML文件中的“出生日期”没有子标记,且标记的数据必须是日期型,即内容必须是“yyyy-mm-dd”形式。
3、复杂类型元素
对于XML文件中有子标记的标记, XML Schema模式可以使用“复杂类型”元素累约束。 XML Schema模式中“复杂类型”元素的格式为:
Html代码 复制代码
  1. <xsd:element name="标记名称"> 
  2.     <xsd:complexType> 
  3.         对子标记约束的元素 
  4.     </xsd:complexType> 
  5. </xsd:element> 
“复杂类型”元素中最重要的部分就是“对子标记约束的元素”部分,如果该“复杂类型”元素想约束name指定的标记顺序出现几个子标记,而且这些子标记在模式中已经有全局元素对其进行了约束,那么“对子标记约束的元素”部分可以是使用带ref属性的元素,例如:
Html代码 复制代码
  1. <xsd:element name="标记名称"> 
  2.     <xsd:complexType> 
  3.         <xsd:sequence> 
  4.             <xsd:element ref="子标记1" /> 
  5.             <xsd:element ref="子标记2" /> 
  6.          <xsd:sequence> 
  7.     </xsd:complexType> 
  8. </xsd:element> 
  9. <xsd:element name="子标记1" type="简单数据类型" /> 
  10. 如果对子标记的约束不想引用全局元素,或没有约束该子标记的全局元素,“对子标记约束的元素”还可以是一个“复杂类型”元素。例如: 
  11. <xsd:element name="标记名称"> 
  12.     <xsd:complexType> 
  13.         <xsd:sequence> 
  14.         <xsd:element name="子标记1" > 
  15.             < xsd:complexType> 
  16.                 ....................... 
  17.              < /xsd:complexType> 
  18.         </xsd:elemnt>      
  19.          <xsd:sequence> 
  20.     </xsd:complexType> 
  21. </xsd:element> 
4、属性
对于XML文件中的属性, XML Schema模式使用“attribute”标记累约束,该标记的格式如下:
<xsd:attribute name="属性名字" type="简单数据类型" use="条件">
其中use可取值:“required”、"optional"、"fixed"、"default"
“attribute”标记必须在“复杂类型”元素中使用,指出“复杂类型”元素约束的XML标记应当有怎样的属性,例如:
Html代码 复制代码
  1. <xsd:element name="标记名称"> 
  2.     <xsd:complexType> 
  3.         <xsd:simpleContent> 
  4.             <xsd:extension base="xsd:string"> 
  5.                 <xsd:attribute name="学号" type="xsd:int" use="required"  /> 
  6.             </xsd:extension> 
  7.         </xsd:simpleContent> 
  8.     </xsd:complexType> 
  9. </xsd:element> 

5、Schema的优点
A、Schema本身使用xml语法规则,使用者无需掌握新的语法规则
B、Schema提供了强大的属性表示与类型支持
...

 

 

 

-------------------------------------------------------------------------------------------------------------------------------------

------------------------------------------------------------

XML Schema是XML文档,而DTD有自己的特殊语法。这样,只需要懂得XML的语法规则就可以编写Schema,无须学习其他的语法规则;XML文件与XML Schema文件可以用相同的解析器进行解析,无须两套解析器;XML Schema有强大、易用的扩展性。
XML Schema利用命名空间将文档中的特殊的节点与Schema说明相联系,一个XML文件可以有多个Schema,而对于DTD一个XML只能有一个相对应的DTD。
XML Schema内容模型是开发的,可以随意扩充,而DTD则无法解析扩充的内容。
DTD只能把内容类型定义为一个字符串,而XML Schema允许把内容类型定义为整形、浮点型、布尔型等等,而无须重定义。

综上,XML Schema较DTD有着优势,所以尽量把XML Schema作为首选为佳。

 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值