DTD和Schema都是用来描述xml文档结构,限定文档的数据类型的。XML无非就是元素的集合,元素可以有属性,可以再嵌套元素。DTD和Schema就是限制可以出现哪些元素,元素的属性以及嵌套元素的个数等;
1.DOCTYPE:
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称。又分以下两种情况:
a.内部DTD:
内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容.
b.外部DTD,又分为私有和公有两种情况:
I.私有DTD使用SYSTEM表示,接着是外部DTD的URL.
II.公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL.
DTD文件编写方法
组成:DTD分别用ELEMENT, ATTLIST, ENTITY, #PCDATA, #CDATA来描述.
1.PCDATA 会被解析器解析的文本, 这些文本将被解析器检查实体以及标记
2.CDATA 是不会被解析器解析的文本
3.ELEMENT:
a.<!ELEMENT 元素名称 EMPTY> 描述空元素(没有子节点和属性的元素);
b.<!ELEMENT 元素名称 (子元素名称 1,子元素名称 2,.....)> 描述元素包含的子元素序列.
c.<!ELEMENT 元素名称 (#PCDATA)> 描述只有PCDATA的元素,
4.ATTLIST:
语法:<!ATTLIST 元素名称 属性名称 属性类型 默认值> 声明元素拥有的属性.
以下是属性类型及解释:
CDATA | 值为字符数据 (character data) |
(en1|en2|..) | 此值是枚举列表中的一个值 |
ID | 值为唯一的 id |
IDREF | 值为另外一个元素的 id |
IDREFS | 值为其他 id 的列表 |
NMTOKEN | 值为合法的 XML 名称 |
NMTOKENS | 值为合法的 XML 名称的列表 |
ENTITY | 值是一个实体 |
ENTITIES | 值是一个实体列表 |
NOTATION | 此值是符号的名称 |
xml: | 值是一个预定义的 XML 值 |
以下是默认值参数可使用的值:
#REQUIRED属性值是必需的
#IMPLIED属性不是必需的
#FIXED value 属性值是固定的
5.ENTITY
<!ENTITY 实体名称 "实体的值">, 如:
<!ENTITY writer "Bill Gates">
<!ENTITY copyright "Copyright W3School.com.cn">
则在xml中可以这样引用它们:
<author>&writer;©right;</author>
实体引用字符
< <
> >
& &
" "
' '