什么是XML |
- XML 指可扩展标记语言(EXtensible Markup Language)。
- XML 是一种很像HTML的标记语言。
- XML 的设计宗旨是传输数据,而不是显示数据。
- XML 标签没有被预定义。您需要自行定义标签。
- XML 被设计为具有自我描述性。
- XML 是 W3C 的推荐标准。
总结:XMl可扩展标记语言,是一种标记新语言,类似html,用来存储和简化数据
XML和HTML的区别 |
XML 不是 HTML 的替代,XML 和 HTML 为不同的目的而设计:
- XML 核心是数据传输,主要是数据内容
- HTML 核心用来显示数据,主要是数据的外观。
- HTML主要是显示信息,而XML主要是传输信息。
XML的结构 |
所有的XML文件,均由以下模块构成:
元素、属性、实体、PCDATA、CDATA
元素
- 一个原色可以包含:其他元素、文本、属性、或者混合元素、文本、属性
- 元素是开始标签、结束标签以及于二者之间所有内容
- 元素是区分大小写的
- 元素要正确嵌套
- XML元素都要正确关闭
<font size=4>**根元素**:
- XML文件的结构上是一种树状结构,他从根部开始,然后扩展到职业
- XML元素必须包含在一个单一元素中,这个元素就成为根元素,它包含文档中所有文本和所有其他元素
- XML必须要有跟元素
属性
- XML属性类似于HTML,属性提供有关元素的额外属性
- XML 属性必须加引号或单引号
<person sex="female">或者<person sex='female'>
元素和属性的却别与联系
(1)元素适合于表示层次结构
(2)属性是属于某个元素,必须写在某个元素的头标记里面,不能嵌套,适合直接表示某个数据
(3)文本内容放在元素标记之间,也可以用属性来表示,用属性表示时可以有名字,但是放在标记之间时没有名字,现在一般都把数据放在属性里面,放在元素标记之间的情况比较少
实体
实体是对数据的引用;根据实体种类的不同,XML 解析器将使用实体的替代文本或者外部文档的内容来替代实体引用。
实体包含:字符实体、命名实体、外部实体、参数实体
字符 | 实体引用 |
---|---|
& | & amp; |
> | >; |
< | <; |
," | "; |
CDATA与PCDATA
CDATA全名:character data:所有 XML 文档中的文本均会被解析器解析。只有 CDATA 区段(CDATA section)中的文本会被解析器忽略。
在标记CDATA下,所有的标记、实体引用都被忽略,而被XML处理程序一视同仁地当做字符数据看待
CDATA的形式如下:
<![CDATA[文本内容]]>
CDATA的文本内容中不能出现字符串“]]>”,另外,CDATA不能嵌套。
在XML中,注释是用“<!--" 和“--”>”引起来的
PCDATA 指的是被解析的字符数据(Parsed Character Data)。
良好的XML |
- 拥有正确语法
- 通过DTD验证XML被称为“形式良好”的XML
- 格式良好的XML会遵守以下语法规则:
XML文件必须有根元素
XML文件必须有关闭标签
XML标记对大小写敏感
XML元素必须被正确的嵌套
XML属性必须加引号
总结 |
此博客主要介绍了XML的结构,根据元素、属性、实体、PCDATA、CDATA这5个结构模块介绍的,算是很初级的入门了。