一、XML约束概述
1、什么是XML约束?
- 在xml技术里,可以编写一个文档来约束一个xml文档的写法,这称之为XML约束
2、XML约束的作用
- 约束xml文档的写法
- 对xml进行校验
3、常见的XML约束技术
- XML DTD(Document Type Definition),全称为文档类型定义
- XML Schema
二、DTD约束语法
1、元素定义
- 在DTD文档中使用ELEMENT声明一个XML元素,语法格式:<!ELEMENT 元素名称 元素约束>
- 元素约束可以是元素内容、或存放类型
- 如为元素内容:则需要使用()括起来,如:<!ELEMENT 书架 (书名,作者,售价)> <!ELEMENT 书名 (#PCDATA)>
- 如为存放类型,则直接书写,DTD规范定义了如下几种类型:EMPTY:用于定义空元素,例如<br/> <hr/> ANY:表示元素内容为任意类型。
- 元素内容中可以使用如下方式,描述内容的组成关系
- 用逗号分隔,表示内容的出现顺序必须与声明时一致。<!ELEMENT MYFILE (TITLE,AUTHOR,EMAIL)> 用|分隔,表示任选其一,即多个只能出现一个<!ELEMENT MYFILE (TITLE|AUTHOR|EMAIL)>
- 在元素内容中也可以使用+、*、?等符号表示元素出现的次数:+: 一次或多次 (书+) ?: 0次或一次 (书?) *: 0次或多次 (书*)
- 也可使用圆括号( )批量设置,例<!ELEMENT MYFILE ((TITLE*, AUTHOR?, EMAIL)* | COMMENT)>
2、属性定义
- dtd文档中的标签属性需通过ATTLIST为其设置属性
-
语法格式: <!ATTLIST 元素名 属性名1 属性类型 属性约束 属性名2 属性类型 属性约束 …… > 属性声明举例: <!ATTLIST 商品 类别 CDATA #REQUIRED 颜色 CDATA #IMPLIED > 对应XML文件: <商品 类别="服装" 颜色="黄色">…</商品> <商品 类别="服装">…</商品>
- 属性约束:
- #REQUIRED:必须设置该属性
- #IMPLIED:可以设置也可以不设置
- #FIXED:说明该属性的取值固定为一个值,在 XML 文件中不能为该属性设置其它值。使用该元素时无需为其分配该属性,XML处理器会自动为给属性增加固定值
- 直接使用默认值:在 XML 中可以设置该值也可以不设置该属性值。若没设置则使用默认值。
-
举例: <!ATTLIST 页面作者 姓名 CDATA #IMPLIED 年龄 CDATA #IMPLIED 联系信息 CDATA #REQUIRED 网站职务 CDATA #FIXED "页面作者" 个人爱好 CDATA "上网" >
- 常用属性类型
-
CDATA:表示属性值为普通文本字符串。 ENUMERATED 枚举 ID唯一的id ENTITY(实体)
- 属性值类型--ENUMERATED
- 属性的类型可以是一组取值的列表,在 XML 文件中设置的属性值只能是这个列表中的某个值(枚举)
-
<?xml version = "1.0" encoding="GB2312" standalone="yes"?> <!DOCTYPE 购物篮 [ <!ELEMENT 肉 EMPTY> <!ATTLIST 肉 品种 ( 鸡肉 | 牛肉 | 猪肉 | 鱼肉 ) "鸡肉"> ]> <购物篮> <肉 品种="鱼肉"/> <肉 品种="牛肉"/> <肉/> </购物篮>
- 属性值类型-- ID,表示属性的设置值为一个唯一值,在整个xml中id不可重复
- ID 属性的值只能由字母,下划线开始,不能使用数字,不能出现空白字符
-
<?xml version = "1.0" encoding="gb2312" ?> <!DOCTYPE 联系人列表[ <!ELEMENT 联系人列表 ANY> <!ELEMENT 联系人 (姓名,EMAIL)> <!ELEMENT 姓名 (#PCDATA)> <!ELEMENT EMAIL (#PCDATA)> <!ATTLIST 联系人 编号 ID #REQUIRED> ]> <联系人列表> <联系人 编号="a1"> <姓名>张三</姓名> <EMAIL>zhang@it315.org</EMAIL> </联系人> <联系人 编号="a2"> <姓名>李四</姓名> <EMAIL>li@it315.org</EMAIL> </联系人> </联系人列表>
- 实体定义 ,实体用于为一段内容创建一个别名,以后在XML文档中就可以使用别名引用这段内容了
- 在DTD定义中,一条<!ENTITY …>语句用于定义一个实体。
- 实体可分为两种类型:引用实体和参数实体
- 引用实体
- 引用实体主要在 XML 文档中被应用
-
语法格式: <!ENTITY 实体名称 “实体内容” >:直接转变成实体内容 引用方式:&实体名称; 举例: <!ENTITY copyright “I am a programmer"> …… ©right;
- 参数实体
- 参数实体被 DTD 文件自身使用
-
语法格式: <!ENTITY % 实体名称 "实体内容" > 引用方式:%实体名称; 举例1: <!ENTITY % TAG_NAMES "姓名 | EMAIL | 电话 | 地址"> <!ELEMENT 个人信息 (%TAG_NAMES; | 生日)> <!ELEMENT 客户信息 (%TAG_NAMES; | 公司名)> 举例2: <!ENTITY % common.attributes " id ID #IMPLIED account CDATA #REQUIRED " > ... <!ATTLIST purchaseOrder %common.attributes;> <!ATTLIST item %common.attributes;>
3、引入DTD约束的两种方式
- DTD的约束可以定义在XML文件内部,如果DTD被定义在了XML内部则XML文档声明中standalone="yes"
- DTD的约束也可以定义在一个独立的后缀为.dtd的文件中再由xml文件引入,此时引入此dtd的xml文档声明中standalone="no"
- 注意:.dtd文件应使用UTF-8或Unicode编码
-
在xml文件内编写DTD <?xml version="1.0" encoding="UTF-8" standalone="yes"?> <!DOCTYPE 书架 [ <!ELEMENT 书架 (书+)> <!ELEMENT 书 (书名,作者,售价)> <!ELEMENT 书名 (#PCDATA)> <!ELEMENT 作者 (#PCDATA)> <!ELEMENT 售价 (#PCDATA)> ]> <书架> <书> <书名>Java就业培训教程</书名> <作者>张孝祥</作者> <售价>39.00元</售价> </书> ... </书架>
- XML中引用DTD约束
- XML文件使用 DOCTYPE 声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:
-
当引用的文件在本地时,采用如下方式: <!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL"> 例如:<!DOCTYPE 书架 SYSTEM “book.dtd”> 当引用的文件是一个公共的文件时,采用如下方式: <!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL"> 例如:<!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" "http://java.sun.com/dtd/web-app_2_3.dtd">
4、编程校验XML文档正确性
- 默认的情况下IE浏览器内置的XML解析器的 约束校验器是被关闭了的。所以我们需要使用JavaScript手动创建解析器对象,打开约束校验功能,对XML进行约束校验。
-
创建xml文档解析器对象 var xmldoc = new ActiveXObject("Microsoft.XMLDOM"); 开启xml校验 xmldoc.validateOnParse = "true"; 装载xml文档 xmldoc.load("book.xml"); 获取错误信息 xmldoc.parseError.reason; xmldoc.parseError.line