http://www-128.ibm.com/developerworks/cn/xml/x-dtdint/index.html
XML 的优点在于它允许您定义自己的有意义的标记,因此您可以最大程度地定制文档。但 XML 就是 XML(可扩展),而人就是人(疯狂的人),这可能很快就会无法控制。解决方案是 DTD,它指定了 XML 文档的标记。简而言之,DTD 指定:可以在文档中存在的元素、那些元素可以具有的属性、在元素内部元素的层次结构以及元素在整个文档中出现的顺序。
虽然 DTD 不是必需的,但它们确实带来方便。DTD 适合三个基本用途。它能:
- 对标记编制文档
- 加强标记参数内部的一致性
- 使 XML 语法分析器能够确认文档
如果不对 XML 文档进行 DTD 定义,文档就无法由 XML 语法分析器进行确认。使用 XML Schema 实例来代替 DTD 如何?(请参阅侧栏 模式如何?)清单 3 是清单 1 中显示的 XML 文档的 DTD。
![](https://i-blog.csdnimg.cn/blog_migrate/6810355c2f78c12e91b7997a8e8c583a.gif)
![](https://i-blog.csdnimg.cn/blog_migrate/6810355c2f78c12e91b7997a8e8c583a.gif)
![](https://i-blog.csdnimg.cn/blog_migrate/6810355c2f78c12e91b7997a8e8c583a.gif)
![](https://i-blog.csdnimg.cn/blog_migrate/6810355c2f78c12e91b7997a8e8c583a.gif)
![](https://i-blog.csdnimg.cn/blog_migrate/6810355c2f78c12e91b7997a8e8c583a.gif)
清单 3 中 DTD 的第一行定义了 XML 文档的父元素: person
。person 元素有两个子元素: firstname
和 lastname
。
第二和第三行包含了元素属性 #PCDATA
,它表明 firstname
和 lastname
元素可能包含经过语法分析的字符数据(在这种情况下是文本)。DTD 文件的最后一行描述了一个空标记: nothing
。
从清单 3 中的 DTD 可以看出,任何阅读我们的 XML 文档的人(以及对它进行语法分析的语法分析器)都知道 person
元素仅包含两个文本元素: firstname
和 lastname
。此外,DTD 规定,在整个文档中, firstname
元素必须在 lastname
元素之前出现。
在转到更复杂的示例之前,让我们回顾一下一些最常用的 DTD 语法元素。可以在 W3C 主页上找到完整的 DTD 规范(请参阅 参考资料)。
A、B、C 和 D 是在下例中代表元素的变量。
元素必须有正好一个 A
、至少一个 B
(由加号表示)、零个或多个 C
(由星号表示)以及零个或一个 D
(由问号表示):
![](https://i-blog.csdnimg.cn/blog_migrate/6810355c2f78c12e91b7997a8e8c583a.gif)
![](https://i-blog.csdnimg.cn/blog_migrate/6810355c2f78c12e91b7997a8e8c583a.gif)
元素可能有 A
或 B
或 C
之一:
![](https://i-blog.csdnimg.cn/blog_migrate/6810355c2f78c12e91b7997a8e8c583a.gif)
![](https://i-blog.csdnimg.cn/blog_migrate/6810355c2f78c12e91b7997a8e8c583a.gif)
元素不包含任何内容:
<!ELEMENT element EMPTY>
元素可以包含在 DTD 中列出的任何元素:
<!ELEMENT element ANY> |
元素可能包含经过语法分析的字符数据或另一个元素( element2
)。星号(*)表示混合内容模型 — 其中元素可以包含不同类型的属性。
<!ELEMENT element (#PCDATA|element2)*> |
下例将文本 "entity reference" 插到文档中它出现的任何地方:
<!ENTITY element "entity reference"> |
可以看到在 XML 文档中该实体引用元素如下:
&element; |
下例表明其元素是一个包含三个属性的空标记:属性 1( att1
)是一个可选属性,属性 2( att2
)是带有固定值 "A"
的属性,属性 3( att3
)是必需的文本属性。
<!ELEMENT element EMPTY>
<!ATTLIST element
att1 ID #IMPLIED
att2 CDATA #FIXED "A"
att3 CDATA #REQUIRED>
|
可以看到在 XML 文档中使用的这个元素如下:
<element att2="A" att3="MustHave"/> |
属性 CDATA
表示包括的信息应该是文本。 ID
属性表明必须填入唯一的标识。每个元素只能有一个 ID
属性。另外, CDATA
表示 att2
和 att3
可能包含任何字符串。