XML 被设计用来传输和存储数据
HTML 被设计用来显示数据
XML指可扩展标记语言
-
特点
-
xml与操作系统、编程语言的开发平台无关
-
实现不同系统之间的数据交换
-
-
作用
-
数据交互
-
配置应用程序和网站
-
Ajax基石
-
XML标签
-
XML文档内容由一系列标签元素组成
<元素名 属性名="属性值">元素内容</元素名>
-
属性值用双引号包裹
-
一个元素可以由多个属性
-
属性值不能直接包含<、"、&
-
不建议使用的字符:'、>
XML编写注意事项
-
所有XML元素多必须有结束标签
-
XML标签对大小写敏感
-
XML必须正确的嵌套
-
统计标签以缩进对齐
-
元素名称可以包含字母、数字或其他的字符
-
元素名称不能以数字或者标点符号开始
-
元素名称中不能含空格
XML 标签没有被预定义,需要自行定义标签
XML 被设计为具有自我描述性
XML是W3C的推荐标准
XML不会做任何事情
XML被设计用来结构化、存储以及传输信息
例如
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
-
上面的这条便签具有自我描述性。它包含了发送者和接受者的信息,同时拥有标题以及消息主体。
-
但是,这个 XML 文档仍然没有做任何事情。它仅仅是包装在 XML 标签中的纯粹的信息。我们需要编写软件或者程序,才能传送、接收和显示出这个文档。
通过XML可以发明自己的标签
-
上面实例中的标签没有在任何 XML 标准中定义过(比如 <to> 和 <from>)。这些标签是由 XML 文档的创作者发明的。
-
这是因为 XML 语言没有预定义的标签。
-
HTML 中使用的标签都是预定义的。HTML 文档只能使用在 HTML 标准中定义过的标签(如 <p>、<h1> 等等)。
-
XML 允许创作者定义自己的标签和自己的文档结构。
XML是对HTML的补充
XML是独立于软件和硬件的信息传输工具
XML用途
XML 应用于 Web 开发的许多方面,常用于简化数据的存储和共享。
XML把数据从html分离
-
通过XML,数据能够存储在独立的XML文件中,修改底层数据时不需要对HTML进行任何修改
-
通过使用JavaScript代码,就可以读取一个外部XMl文件,并更新网页的数据内容
XML简化数据共享
避免数据格式不兼容,XML数据以纯文本格式进行存储,因此提供了一种独立于软件和硬件的数据存储方法
XML简化数据传输
可以通过各种不兼容的应用程序来读取数据,以xml狡猾数据降低了这种复杂性
XML简化平台变更
XML数据以文本格式存储,这是的XML在不损失数据的情况下,更容易扩展或升级到新的操作系统、新的应用程序或新的浏览器
XML用于创建新的互联网语言
XHTML
用于描述可用的Web服务的WSDL
作为手持设备的标记语言的WAP和WML
用于新闻 feed 的 RSS 语言
描述资本和本体的 RDF 和 OWL
用于描述针对 Web 的多媒体的SMIL
XML 树结构
XML文档形成了一种树结构,他从"根部"开始,然后扩展到树叶
一个XML文档案例
<?xml version="1.0" encoding="UTF-8"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
第一行时XML声明。它定义XML的版本(1.0)和所使用的编码(UTF-8:万国码,可现实各种语言)。
下一行描述问的的根元素 <note>
下面4行描述根的4个子元素(to,from,heading以及body)
最后一行定义根元素的结尾
XML文档形成一种树结构
-
XML文档必须包含根元素,该元素是所有其他元素的父元素
-
XML文档中的元素形成了一个文档树,这个树从根部开始,并扩展到树的最低端
-
所有的元素都可以有子元素
<root>
<child>
<subchild>...</subchild>
</child>
</root>
-
父、子以及同胞等术语用于描述元素之间的关系。父元素拥有子元素。相同层级上的子元素成为同胞(兄弟伙姐妹)
-
所有的元素都可以有文本内容和属性(类似HTML中)
XML文档实例 表述书店中的书本信息
<bookstore>
<book category="COOKING">
<title lang="en">Everyday Italian</title>
<author>Giada De Laurentiis</author>
<year>2005</year>
<price>30.00</price>
</book>
<book category="CHILDREN">
<title lang="en">Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>
<book category="WEB">
<title lang="en">Learning XML</title>
<author>Erik T. Ray</author>
<year>2003</year>
<price>39.95</price>
</book>
</bookstore>
XML语法规则
XML声明
XML声明文件的可选部分,如果存在需要放在文档的第一行,如下所示:
<?xml version="1.0" encoding="utf-8"?>
以上实列包含XML版本(version="1.0"),甚至包含字符编码(encoding = "utf-8")
UTF-8 也是 HTML5,CSS,JavaScript,PHP和SQL的默认编码
XML文档必须有根元素
XML必须包含根元素,他是所有其他元素的父元素,比如以下实例中root就是根元素:
<root>
<child>
<subchild>.....</subchild>
</child>
</root>
XML文档由元素构成,每个元素包含开始标签、结束标签和元素内容
属性
元素可以包含属性,属性提供有关元素的附加信息
属性位于开始标签中,例如:
<person age = "30" gender = "male" >John Doe</person>
XML单标签
-
所有的XML元素一般都有一个关闭标签,但也允许单标签的使用
-
单标签是指在一个标签中同时包含了开始和结束标签,形式类似于HTML中的空元素标签
-
在XML中,可以使用已下两种方式表示单标签:
-
使用空元素标签:<exampleTag/>
-
使用开始和结束标签,但是不包含任何内容
这两种表示方式是等效的,可以根据个人或项目的约定选择使用
在许多XML解释器中,都会将这两种形式解释为相同的结构
XML标签对大小写敏感
-
XML标签对大小写敏感。标签<Letter>与标签<letter>是不同的
-
必须使用相同的大小写来编写打开标签和关闭标签:
-
<Message>这是错误的</message>
-
<message>这是正确的</message>
-
打开标签和关闭标签通畅被称为开始标签和结束标签。
XML必须正确嵌套
-
在HTML中,常会看到没有正确嵌套的元素:
-
<b><i>This text is bold and italic</b></i>
-
-
在XML中,所有元素都必须彼此正确地嵌套:
-
<b><i>This text is bold and italic</i></b>
-
正确嵌套的意思是:由于<i>元素是在<b>元素内打开的,那么他必须在<b>元素内关闭
XML属性值必须加引号
-
与HTML类型,XML元素也可拥有属性(名称/值的对)
-
在XML中,XML的属性值必须加引号
如下:
<note date=12/11/2007>
<to>Tove</to>
<from>Jani</from>
</note>
<note date="12/11/2007">
<to>Tove</to>
<from>Jani</from>
</note>
第一个是错误的,第二个是正确的
实体引用
在XML中,一些字符拥有特殊的意义
如果把字符“<”放在XML元素中,会发生错误,这是因为解析器会把它当作新元素的开始
如下会产生XML错误:
<message>if salary < 1000 then</message>
为了避免这个错误,用尸体引用来代替“<”字符:
如下:
<message>if salary < 1000 then</message>
在XML中,有5个预定义的实体引用:
注:在XML中,只有字符“<”和“&”是非法的,大于号是合法的,但是实体引用来代替它是一个好习惯
XML中的注释
在XML中编写注释的语法与HTML的语法很相似
<!-- This is a comment -->
在XML中,空格会被保留
-
HTMl会把多个连续的空格字符裁剪(合并)为一个
-
在XML中,文档中的空格不会被裁剪
XML以LF存储换行
-
在 Windows 应用程序中,换行通常以一对字符来存储:回车符(CR)和换行符(LF)。
-
在 Unix 和 Mac OSX 中,使用 LF 来存储新行。
-
在旧的 Mac 系统中,使用 CR 来存储新行。
-
XML 以 LF 存储换行。
XML元素
XML文档包含XLM元素
什么是XML元素
XML元素指的是从(且包括)开始标签知道(且包括)结束标签的部分
一个元素可以包含:
-
其他元素
-
文本
-
属性
-
或者混合以上所有...
XML命名规则
XML元素必须遵循以下命名规则:
-
名字可以包含字母、数字以及其他的字符
-
名称不能以数字或者标签符号开始
-
名称不能以字母xml(或者XML、Xml等等)开始
-
名称不能包含空格
最佳命名习惯
-
使名称具有描述性。使用下划线的名称也很不错:<first_name>、<last_name>。
-
名称应简短和简单,比如:<book_title>,而不是:<the_title_of_the_book>。
-
避免 "-" 字符。如果您按照这样的方式进行命名:"first-name",一些软件会认为您想要从 first 里边减去 name。
-
避免 "." 字符。如果您按照这样的方式进行命名:"first.name",一些软件会认为 "name" 是对象 "first" 的属性。
-
避免 ":" 字符。冒号会被转换为命名空间来使用(稍后介绍)。
-
XML 文档经常有一个对应的数据库,其中的字段会对应 XML 文档中的元素。有一个实用的经验,即使用数据库的命名规则来命名 XML 文档中的元素。
-
在 XML 中,éòá 等非英语字母是完全合法的,不过需要留意,您的软件供应商不支持这些字符时可能出现的问题。
XML元素是可扩展的
XML元素是可扩展的,以携带更多的信息
XML的优势之一,就是可以在不中断应用程序的情况下进行扩展(添加额外的信息)
XML属性
XML元素具有属性,类似 HTML。
属性(Attribute)提供有关元素的额外信息。
XML属性
在HTML中,属性提供有关元素的额外信息:
<img src="computer.gif">
<a href="demo.html">
属性通常提供不属于数据组成部分的信息。在下面的实例中,文件类型与数据无关,但是对需要处理这个元素的软件来说却很重要:
<file type="gif">computer.gif</file>
XML属性必须加引号
属性值必须被引号包围,不过单引号和双引号均可使用。比如一个人的性别,person 元素可以这样写
<person sex="female">
或者也可以这样:
<person sex='female'>
如果属性值本身包含双引号,可以使用单引号:
<gangster name='George "Shotgun" Ziegler'>
或者可以使用字符实体:
<gangster name="George "Shotgun" Ziegler">
XML元素 vs .属性
如下:
<person sex="female">
<firstname>Anna</firstname>
<lastname>Smith</lastname>
</person>
<person>
<sex>female</sex>
<firstname>Anna</firstname>
<lastname>Smith</lastname>
</person>
在第一个实例中,sex 是一个属性。在第二个实例中,sex 是一个元素。这两个实例都提供相同的信息。
没有什么规矩可以告诉我们什么时候该使用属性,而什么时候该使用元素。我的经验是在 HTML 中,属性用起来很便利,但是在 XML 中,您应该尽量避免使用属性。如果信息感觉起来很像数据,那么请使用元素吧。
避免XML属性?
因为使用属性而引起的一些问题:
-
属性不能包含多个值(元素可以)
-
属性不能包含树结构(元素可以)
-
属性不容易扩展(为未来的变化)
属性难以阅读和维护,尽量使用元素来描述数据,仅仅使用属性来提供与数据无关的信息。
针对元数据的XML属性
- 有时候会向元素分配ID引用,这些ID索引可以用于表示XML元素,它起作用的方式与HTML中id属性是一样的
- id属性仅仅是一个标识符,用于表示不同的标签,他并不是标签数据的组成部分
- 元数据(有关数据的数据)应当存储为属性,而数据本身应当存储为元素