xml的dtd简单使用和Schema
一,dtd
1,dtd的详细介绍
文档类型定义(Document Type Definition)是一套为了进行程序间的数据交换而建立的关于标记符的语法规则。它是标准通用标记语言和 [1] 可扩展标记语言1.0版规格的一部分,文档可根据某种DTD语法规则验证格式是否符合此规则。文档类型定义也可用做保证标准通用标记语言、可扩展标记语言文档格式的合法性,可通过比较文档和文档类型定义文件来检查文档是否符合规范,元素和标签使用是否正确。文件实例提供应用程序一个数据交换的格式。使用各类文档类型定义是为了让标准通用标记语言、可扩展标记语言文件能符合规定的数据交换标准,因为这样,不同的公司只需定义好标准文档类型定义,就都能依文档类型定义建立文档实例,并且进行验证,如此就可以轻易交换数据,防止了实例数据定义不同等原因造成的数据交换障碍,满足了网络共享和数据交互。文档类型定义文件是一个美国信息交换标准代码文本文件。
2.dtd元素的定义的语法和分类
<!ELEMENT element-name (type)><!ELEMENT element-name EMPTY>//空元素 <!ELEMENT element-name (#PCDATA)>//文本元素 <!ELEMENT element-name (e1,e2)>//混合元素注:根标签也要定义!!!
<!DOCTYPE persons [
<!ELEMENT persons (person*)>
<!ELEMENT person (name,age,contact,br?)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT contact (phone|email)>
<!ELEMENT phone (#PCDATA)>
<!ELEMENT br EMPTY>
<!ELEMENT email (#PCDATA)>
]>
3,元素的限制
4,属性定义的语法和类型
<!ATTLIST element-name att_name type >#REQUIRED 必须有
IDREF #IMPLIED 引用性,里面的值必须是ID
CDATA 任意字符
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE persons [
<!ELEMENT persons (person*)>
<!ELEMENT person (name,age,contact,br?)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT contact (phone|email)>
<!ELEMENT phone (#PCDATA)>
<!ELEMENT br EMPTY>
<!ELEMENT email (#PCDATA)>
<!--常见的属性的一些类型
1.ID类型 唯一标识
2.选择类型 性别
3.文本类型
4.依赖
-->
<!ATTLIST person
pid ID #REQUIRED
sex (男|女) '男'
qq CDATA #IMPLIED
parent IDREF #IMPLIED
>
]>
<persons>
<person pid="p1" sex="男" qq="aaa" parent="p2">
<name>张小明</name>
<age>10</age>
<contact>
<phone>1234567</phone>
</contact>
<br/>
</person>
<person pid="p2">
<name>张大明</name>
<age>35</age>
<contact>
<email>123@qq.com</email>
</contact>
</person>
</persons>
属性的CDATA与元素的CDATA节有何区别呢??
属性的CDATA表示属性值是任何的字符,元素里的CDATA节是表示在CDATA节里面的内容不被xml文档进行解析。
#PCDATA与CDATA有何区别??
#PCDATA是限制元素里面的内容是字符类型的,而这个CDATA是限制属性里面的内容是字符类型。
二,Schema
1.Schema的概述
Schema概述:xml Schema是用一套预先规定的xml元素和属性创建的,这些元素和属性定义了xml文档的结构和内容模式。Xml Shema规定xml文档实例的结构和每个元素/属性的数据类型。
理解:对于Schema来讲,我们可以将shema比喻成为是表结构。在表结构里,定义一些数据的限制要求。然后我们xml文档呢就相当于是数据表将来要存储的数据u,也就是数据库里面的数据表数据了,所以整体来讲的话schema它就是用于验证xml文档的。
2.比之DtD Schema的优点
①DTD不遵守xml语法(写xml文档实例时用一种语法,写DTD的时候用另外一种语法);DTD数据类型有限(与数据库数据类型不一致);DTD不可扩展;DTD不支持命名空间(命名冲突)。
②Shema基于xml语法的;Shema可以用能处理xml文档的工具处理;Schema大大扩充了数据类型,可以自定义数据类型;Schema支持元素的继承——Object-Oriented;Shema支持属性组。
3.Schaema的数据类型
1、Schema的数据类型概述
2、简单类型:
(1)内置的数据类型:
基本的数据类型;
扩展的数据类型;
(2)用户自定义简单类型(通过simpleType定义)。
3、复合类型(通过complexType定义)
4、数据类型的特征
4.Schema的元素类型
1、Schema根元素
作用:包含已经定义的Schema 用法:xs:schema
属性:xmlns/targetNamespace/elementFormDefault
例子:
2、element元素 作用:声明一个元素
属性:name/type/ref/minOccurs/maxOccurs
例子:
3、group元素
作用:把一组元素声明组合在一起 属性:name
例子:
4、attribute元素
作用:声明一个属性 属性:name/type/use/default/fixed
例子:
5、attributeGroup元素
作用:把一组属性声明组合在一起 属性:name/ref
例子:
6、simpleType元素
作用:定义一个简单类型,它决定了元素和属性值的约束和相关信息 属性:name
常用的两种方式:restriction——>一个约束;list——>从列表中选择。
(1)simpleType元素的子元素——>restriction
子元素为:xs:restriction——>定义一个约束条件
例子:
(2)simpleType元素的子元素——>list
子元素为:xs:list——>从一个特定数据类型的集合中选择定义一个简单类型元素。
例子:
7、complexType元素
作用:定义一个复合类型,它决定了一组元素和属性值的约束和相关信息。 属性:name
常用的两种方式:sequence——>一个序列;choice——>设置选择项。
(1)complexType元素——sequence
作用:给一组元素一个特定的序列
例子:
(2)complexType元素——choice
作用:把一组属性声明组合在一起,以便可以被复合类型应用
属性:name/ref
例子:
8、complexType与simpleType区别
simpleType类型的元素中不能包含元素或者属性;
当需要声明一个元素的子元素和或属性时,用complexType;
当需要基于内置的基本数据类型定义一个新的数据类型时,用simpleType。