前言:
XML是(Extensible Markup Language)可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。
什么是XML?
XML是可扩展的标记语言,类似于HTML,其设计宗旨是传输数据,而非显示数据。XML标签没有被预定义,需要自行定义标签。XML被设计为具有自我描述性,是W3C的推荐标准。
XML与HTML的主要差异?
1)XML不是HTML的替代。
2)XML和HTML为不同的目的而设计:
XML被设计为传输和存储数据,其焦点是数据的内容;
HTML被设计用来显示数据,其焦点是数据的外观;HTML旨在显示信息,而XML旨在传输信息。
XML文档实例:
<?xml version="1.0" encoding="ISO-8859-1"?>
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>
第一行是XML声明。它定义XML版本(1.0)和所使用的编码(ISO-8859-1=Latin-1/西欧字符集)。
第二行描述文档的跟元素,接下来4行描述跟的4个子元素(to、from、heading以及body)最后一行定义根元素的结尾。
XML文档形成一种树结构:
XML文档必须包含根元素(只能有一个)。该元素是所有其他元素的父元素。XML文档中的元素形成了一颗文档树。这棵树从根部开始,并扩展到树的最低端。
实例:
<bookstore>
<book category="COOKING">
<title lang="en">Everyday Italian</title>
<author>Giada De Laurentiis</author>
<year>2005</year>
<price>30.00</price>
</book>
<book category="CHILDREN">
<title lang="en">Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>
<book category="WEB">
<title lang="en">Learning XML</title>
<author>Erik T. Ray</author>
<year>2003</year>
<price>39.95</price>
</book>
</bookstore>
根元素是<bookstore>,文档中的所有<book>元素都被包含在<bookstore>中。<book>元素有四个子元素:<title>、<author>、<year>、<price>。
实体引用:
为了避免把字符数据和标签中需要用到的一些特殊符号相混淆,XML还提供了实体引用。
字符 | 实体引用 |
& | &; |
> | >; |
< | <; |
“ | "; |
, | &apos; |
格式良好的XML:
1)格式良好Well-formed;
2)拥有正确语法的XML被称为“形式良好”的XML;
3)通过DTD验证的XML是“合法”的XML;
4)格式良好的XML会遵循以下XML语法规则:
a.XML文件必须有根元素;
b.XML文件必须有关闭标签;
c.XML标记对大小写敏感;
d.XML元素必须被正确的嵌套;
e.XML属性必须加引号;