xml学习笔记(2)DTD约束
1.什么是XML约束
在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称为XML约束.
常用的约束技术: XML DTD, XML Schema
2.DTD约束
DTD(Document Type Definition,文档类型定义).
例子:
book.xm文件:
<?xml version="1.0" ?>
<!DOCTYPE 书架 SYSTEM "book.dtd">
<书架>
<书>
<书名>Java程序设计教程</书名>
<作者>某某</作者>
<售价>30</售价>
</书>
<书>
<书名>Java Web程序设计教程</书名>
<作者>某某</作者>
<售价>40</售价>
</书>
</书架>
book.dtd文件:
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
3.DTD约束的两种方式
DTD约束即可以作为一个单独的文件编写,也可以在XML文件内编写.
XML文件内编写例子:
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<!DOCTYPE 书架 [
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
]>
<书架>
<书>
<书名>Java程序设计教程</书名>
<作者>某某</作者>
<售价>30</售价>
</书>
...
</书架>
4.引用DTD约束
XML文件使用DOCTYPE声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:
·当引用的文件在本地时,采用如下方式:
<!DOCTYPE 文档根节点 SYSTEM "DTD文件的URL">
例如: <!DOCTYPE 书架 SYSTEM "book.dtd">
·当引用的文件是一个公共的文件时,采用如下方式:
<!DOCTYPE 文档根节点 PUBLIC "DTD名称" "DTD文件的URL">
例如: <!DOCTYPE web-app PUBLIC
"-//Sun Microsystems,Inc.//DTD Web Application 2.3//EN"
"http://java.sun.com/dtd/web-app_2_3.dtd">
5.DTD约束语法--元素定义
在DTD文档中使用ELEMENT声明一个XML元素,语法格式如下:
<!ELEMENT 元素名称 元素类型>
元素类型可以是元素内容、或类型
·如为元素内容,则需要使用()括起来,如:
<!ELEMENT 书架 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
·如为元素类型,则直接书写,DTD规范定义了如下几种类型:
·EMPTY: 用于定义空元素,例如<br/> <hr/>
·ANY: 表示元素内容为任意类型.
元素内容中可以使用如下方式,描述内容的组成关系:
·用逗号分隔,表示内容的出现顺序必须与声明时一致.
<!ELEMENT MYFILE (TITLE,AUTHOR,EMAIL)>
·用|分隔,表示任选其一,即多个只能出现一个
<!ELEMENT MYFILE (TITLE|AUTHOR|EMAIL)>
在元素内容中也可以使用+,*,?等符号表示元素出现的次数:
+ : 一次或多次 (书+)
? : 0次或一次 (书?)
* : 0次或多次 (书*)
也可使用圆括号()批量设置,例:
<!ELEMENT MYFILE ((TITLE*,AUTHOR,EMAIL)*|COMMENT)>
6.DTD约束语法--属性定义
xml文档中的标签属性(attribute)需要通过ATTLIST为其设置属性
语法格式:
<!ATTLIST 元素名
属性名1 属性值类型 设置说明
属性名1 属性值类型 设置说明
......
>
属性声明举例:
<!ATTLIST 商品
类别 CDATA #REQUIRED
颜色 CDATA #IMPLIED
>
对应XML文件:
<商品 类别="服装" 颜色="黄色">...</商品>
<商品 类别="服装">...</商品>
设置说明:
·REQUIRED: 必须设置该属性
·IMPLIED: 可以设置也可以不设置
·FIXED: 说明该属性的取值固定为一个值,在XML文件中不能为该属性设置其它值,但需要为该属性提供这个值.
·直接使用默认值: 在XML中可以设置该值也可以不设置该属性值,若没有设置则使用默认值
例子:
<!ATTLIST 网页作者
姓名 CDATA #IMPLIED
年龄 CDATA #IMPLIED
联系信息 CDATA #REQUIRED
网站职务 CDATA #FIXED "网页作者"
个人爱好 CDATA "上网"
>
常用属性值类型(CDATA,ENUMERATE,ID,ENTITY):
·CDATA: 表示属性值为普通文本字符串
·ENUMERATED: 属性的类型可以是一组取值的列表,在XML文件中设置的属性值只能是这个列表中的某个值(枚举).
<?xml version="1.0" encoding="GB2312" standalone="yes"?>
<!DOCTYPE 购物篮 [
<!ELEMENT 肉 EMPTY>
<!ATTLIST 肉 品种 (鸡肉|牛肉|猪肉|鱼肉) "鸡肉">
]>
<购物篮>
<肉 品种="鱼肉"/>
<肉 品种="牛肉"/>
<肉/>
</购物篮>
·ID: 表示属性的设置值为一个唯一值,ID属性的值只能有字母、下划线开始,不能出现空白字符.
<?xml version="1.0" encoding="GB2312"?>
<!DOCTYPE 联系人列表 [
<!ELEMENT 联系人列表 ANY>
<!ELEMENT 联系人 (姓名,EMAIL)>
<!ELEMENT 姓名 (#PCDATA)>
<!ELEMENT EMAIL (#PCDATA)>
<!ATTLIST 联系人 编号 ID #REQUIRED>
]>
<联系人列表>
<联系人 编号="a1">
<姓名>张三</姓名>
<EMAIL>zhang@163.com</EMAIL>
</联系人>
<联系人 编号="a2">
<姓名>李四</姓名>
<EMAIL>lisi@163.com</EMAIL>
</联系人>
</联系人列表>
·ENTITY(实体):
7.DTD约束语法--实体定义
实体(ENTITY)用于为一段内容创建一个别名,以后在XML文档中就可以使用别名引用这段内容了.
在DTD定义中,一条<!ENTITY ...>语句用于定义一个实体.
实体可分为两种类型: 引用实体和参数实体.
·引用实体: 主要在XML文档中被应用
语法格式:
<!ENTITY 实体名称 "实体内容"> : 直接转变成实体内容
引用方式: &实体名称;
示例:
<!ENTITY copyright "I am a programmer">
......
©right;
·参数实体: 被DTD文件自身使用
语法格式:
<!ENTITY % 实体名称 "实体内容">
引用方式: %实体名称;
示例1:
<!ENTITY % TAG_NAMES "姓名|EMAIL|电话|地址">
<!ELEMENT 个人信息 (姓名|EMAIL|电话|地址|生日)>
<!ELEMENT 客户信息 (%TAG_NAMES;|生日)>
示例2:
<!ENTITY % common.attributes
" id ID #IMFILED
account CDATA #REQUIRED "
>
<!ATTLIST purchaseOrder %common.attributes;>
<!ATTLIST item %common.attributes;>