1、SGML、XML、HTML之间的关系
XML是SGML的一个子集,HTML是SGML的一个应用
2、规范的XML文档必须满足下列条件:
(1)语法符合XML规范
(2)一个或多个元素构成一个树状结构,且只有一个根节点
(3)没有对外部实体的引用,除非提供了DTD
3、XML文档的整体结构
(1)XML声明 必备
(2)DOCTYPE声明 (DTD或Schema文档声明等,可选)
(3)实体声明 (字符数据等的替代,可选)
(4)元素 (文档所包含的元素,必须有一个根元素)
4、XML元素
(1)元素的构成
元素定义由开始标签<……>、结束标签</……>和元素内容构成,元素名称和开始标签“<”之间不能有空格。元素的结束标签包含结束符“/”和元素名称。元素名称必须符合命名规范
(2)元素的内容
元素的内容可以是子元素也可以是文本数据,还可以为空
(3)元素及属性的命名规范
a、元素名和属性名以英文字母或下划线“—”开始,后面可用英文字母、数字、点号“.“、连字符“-”、冒号“:”等。中文字符和其他语言文学也可以用于命名元素,这主要取决于文档类型声明中的编码值。通常建议不要在名称中使用点号“.“和连字符”-“。
b、XML保留的标识符如“<"、”/"、“&”等不能出现在元素名和属性名中。
c、元素名不能包含空格
d、XML文档大小写敏感,相同字母不同大小写会被视为不同名称,所以元素的开始标签与结束标签名称必须完全一致
(4)元素的属性
属性的定义:属性名=“属性值”
5、CDATA段
CDATA段是一种可以将特殊字符像正常字符一样使用的方法。声明方法为:
<![CDATA[可以包含<,>,和&等的CDATA段内容]]>