XML入门简介

XML入门简介

--------------------------------------------------------------------------------

XML可以用来描述数据,重点是‘数据是什么’。

HTML则是用来显示数据,重点是‘如何显示数据’。


--------------------------------------------------------------------------------

在学习XML之前你应该已经知道的知识
在你继续之前你应该具有下面一些基础的知识:

WWW, HTML 和设计网页的基础知识
网页脚本语言,比如JavaScript 或者VBScript
你最好在学习XML之前就了解上面的内容,因为在XML的学习过程中将用到这些知识。


--------------------------------------------------------------------------------

什么是XML?
XML是EXtensible Markup Language的缩写
XML是一种类似于HTML的标记语言
XML是用来描述数据的
XML的标记不是在XML中预定义的,你必须定义自己的标记
XML使用文档类型定义(DTD)或者模式(Schema)来描述数据
XML使用DTD或者Schema后就是自描述的语言

--------------------------------------------------------------------------------

XML和HTML的主要区别是什么
XML是用来存放数据的

XML不是HTML的替代品,XML和HTML是两种不同用途的语言。

XML是被设计用来描述数据的,重点是:什么是数据,如何存放数据。
HTML是被设计用来显示数据的,重点是:显示数据以及如何显示数据更好上面。

HTML是与显示信息相关的, XML则是与描述信息相关的。


--------------------------------------------------------------------------------

XML 什么也不做
XML 被设计成什么都不做的。

也许看起来很难理解,但事实上XML确实什么都不做。XML只是用来组织、存储和发送信息的。

下面的例子是Ordm给Lin的便条,使用的是XML格式:

<note>
<to>Lin</to>
<from>Ordm</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>

这个便条有信息头,又信息主体,还包括发送人和接收人。尽管如此,这个XML文档仍然什么都不做,他只是用XML标记存储信息的文件。有人已经编写出来发送和接收并且显示这种格式信息的软件。


--------------------------------------------------------------------------------

XML是自由的、可以扩展的
XML标记并不是预先规定好的,你必须创造你自己的标记。

在HTML文档中必须使用规则中定义好的标记。比如:<P><br><a></a>等等。

XML允许你定义自己的标记以及文档结构。

比如在上面例子中的"<to>"、"<from>"标记都不是在XML规范中事先定义好的。这些标记都是XML文档的作者“创造”出来的。


--------------------------------------------------------------------------------

XML是HTML的补充
XML并不是HTML的替代品。

XML并不是HTML的替代品,理解这一点非常重要。在将来的网页开发中,XML将被用来描述、存储数据,而HTML则是用来格式化和显示数据的。

对于XML最好的形容可能是: XML是一种跨平台的,与软、硬件无关的,处理信息的工具。


--------------------------------------------------------------------------------

XML在未来Web开发中的应用
XML无处不在

XML发展的非常迅速,这实在令人感到惊奇,有很多的软件开发商都采用了XML标准。

我们相信,在未来的Web开发中,XML将和HTML一样受到重视,他们都是Web技术的基础。XML将成为最普遍的数据操纵和数据传输的工具。


--------------------------------------------------------------------------------

XML 笑话
问: 我该在什么时候使用XML?

答: 你可以在你的个人简历中写上你会XML。

如何使用XML?
 
--------------------------------------------------------------------------------

首先要明确的是:XML是被设计用来存储数据、携带数据和交换数据的,他不是为了显示数据而设计的。


--------------------------------------------------------------------------------

XML可以从HTML中分离数据
通过XML,你可以在HTML文件之外存储数据。

在不使用XML时,HTML用于显示数据,数据必须存储在HTML文件之内;使用了XML,数据就可以存放在分离的XML文档中。这种方法可以让你集中精力去到使用HTML做好数据的显示和布局上,并确保数据改动时不会导致HTML文件也需要改动。这样可以方便维护页面。

XML数据同样可以以“数据岛”的形式存储在HTML页面中。你仍然可以集中精力到使用HTML格式化和显示数据上去。


--------------------------------------------------------------------------------

XML用于交换数据
通过XML,我们可以在不兼容的系统之间交换数据。

在现实生活中,计算机系统和数据库系统所存储的数据有N^N种形式,对于开发者来说,最耗时间的就是在遍布网络的系统之间交换数据。

把数据转换为XML格式存储将大大减少交换数据是的复杂性,并且还可以使得这些数据能被不同的程序读取。


--------------------------------------------------------------------------------

XML 和 B2B
使用XML, 可以在网络中交换金融信息。

在不远的将来,我们可以期望看到很多关于XMl和B2B(Business To Business)的应用。

XML正在成为遍布网络的商业系统之间交换金融信息所使用的主要语言。许多与B2B有关的完全基于XML的应用程序正在开发中。


--------------------------------------------------------------------------------

XML可以用于共享数据
通过XML,纯文本文件可以用来共享数据。

既然XML数据是以纯文本格式存储的,那么XML提供了一种与软件和硬件无关的共享数据方法。

这样创建一个能够被不同的应用程序读取的数据文件就变得简单了。同样,我们省级操作系统、升级服务器、升级应用程序、更新浏览器就容易多了。


--------------------------------------------------------------------------------

XML可以用于存储数据
利用XML, 纯文本文件可以用来存储数据。

大量的数据可以存储到XML文件中或者数据库中。应用程序可以读写和存储数据,一般的程序可以显示数据。


--------------------------------------------------------------------------------

XML可以充分利用数据
使用XML,你的数据可以被更多的用户使用。

既然XML是与软件、硬件和应用程序无关的,所以可以使你的数据可以被更多的用户、更多的设备所利用,而不仅仅是基于HTML标准的浏览器哦。

别的客户端和应用程序可以把你的XML文档作为数据源来处理,就像他们对待数据库一样,你的数据可以被各种各样的“阅读器”处理,这时对某些人来说是很方便的,比如盲人或者残疾人。


--------------------------------------------------------------------------------

XML可以用于创建新的语言
XML是WAP和WML语言的母亲。

无线标记语言(WML,The Wireless Markup Language ), 用于标识运行于手持设备上(比如:手机)的Internet程序。

WML采用了XML的标准。你可以在WML 指南中详细的了解。


--------------------------------------------------------------------------------

展望未来
如果开发者有足够的预见性,那么将来的应用程序都应该使用XML的形式来此存储数据。

将来我们所使用的字处理器、电子表格软件和数据库应该能够以纯文本的格式相互读取数据,而不需要经过格式转化的过程。

我们只能期盼微软和其他软件开发商也赞同这一点。//事实上微软正在大力发展XML的应用呢。

XML 语法
 
--------------------------------------------------------------------------------

XML的语法规则既简单又严格,非常容易学习和使用。

正因为如此,编写读取和操作XML的软件也是相对容易的事情。


--------------------------------------------------------------------------------

一个XML文档的例子
XML文档使用了自描述的和简单的语法。

<?xml version="1.0" encoding="ISO-8859-1"?>
<note>
<to>Lin</to>
<from>Ordm</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>

文档的第1行:XML声明——定义此文档所遵循的XML标准的版本,在这个例子里是1.0版本的标准,使用的是ISO-8859-1 (Latin-1/West European)字符集。

文档的第2行是根元素(就象是说“这篇文档是一个便条”):

<note>

文档的第3--6行描述了根元素的四个子节点(to, from, heading,和 body):

<to>Lin</to>
<from>Ordm</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>

文档的最后一行是根元素的结束:

</note>

你能从这个文档中看出这是Ordm给Lin留的便条么?难道能不承认XML是一种美丽的自描述语言么?


--------------------------------------------------------------------------------

所有的XML文档必须有一个结束标记
在XML文档中, 忽略结束标记是不符合规定的。

在HTML文档中,一些元素可以是没有结束标记的。下面的代码在HTML中是完全合法的:

<p>This is a paragraph
<p>This is another paragraph

但是在XML文档中必须要有结束标记,象下面的例子一样:

<p>This is a paragraph</p>
<p>This is another paragraph</p> 

注意: 你可能已经注意到了,上面例子中的第一行并没有结束标记。这不是一个错误。因为XML声明并不是XML文档的一部分,他不是XML元素,也就不应该有结束标记。


--------------------------------------------------------------------------------

XML标记都是大小写敏感的
这与HTML不一样, XML标记是大小写敏感的。

在XML中, 标记<Letter>与标记<letter>是两个不同的标记。

因此在XML文档中开始标记和结束标记的大小写必须保持一致。

<Message>This is incorrect</message>   //错误的
<message>This is correct</message>     //正确的


--------------------------------------------------------------------------------

所有的XML元素必须合理包含
在XML中不允许不正确的嵌套包含。

在HTML中,允许有一些不正确的包含,例如下面的代码可以被浏览器解析:

<b><i>This text is bold and italic</b></i>

在XML中所有元素必须正确的嵌套包含,上面的代码应该这样写:

<b><i>This text is bold and italic</i></b>


--------------------------------------------------------------------------------

所有的XML文档必须有一个根元素
XML文档中的第一个元素就是根元素。

所有XML文档都必须包含一个单独的标记来定义,所有其他元素的都必须成对的在根元素中嵌套。XML文档有且只能有一个根元素。

所有的元素都可以有子元素,子元素必须正确的嵌套在父元素中,下面的代码可以形象的说明:

<root>
<child>
<subchild>.....</subchild>
</child>
</root> 


--------------------------------------------------------------------------------

属性值必须使用引号""
在XML中,元素的属性值没有引号引着是不符合规定的。

如同HTML一样,XML元素同样也可以拥有属性。XML元素的属性以名字/值成对的出现。XML语法规范要求XML元素属性值必须用引号引着。请看下面的两个例子,第一个是错误的,第二个是正确的。

<?xml version="1.0" encoding="ISO-8859-1"?>
<note date=12/11/99>
<to>Lin</to>
<from>Ordm</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>

<?xml version="1.0" encoding="ISO-8859-1"?>
<note date="12/11/99">
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>

第一个文档的错误之处是属性值没有用引号引着。
正确的写法是: date="12/11/99". 不正确的写法: date=12/11/99.


--------------------------------------------------------------------------------

使用XML,空白将被保留
在XML文档中,空白部分不会被解析器自动删除。

这一点与HTML是不同的。在HTML中,这样的一句话:

"Hello              my name is Ordm"将会被显示成:“Hello my name is Ordm”,

因为HTML解析器会自动把句子中的空白部分去掉。


--------------------------------------------------------------------------------

使用XML, CR / LF 被转换为 LF
使用 XML, 新行总是被标识为 LF(Line Feed,换行)。

你知道打字机是什么么?呵呵,打字机是在上个世纪里使用的一种专门打字的机器。^&^

当你用打字机敲完一行字后,你通常不得不再把打字头移动到纸的左端。

在Windows应用程序中,文本中的新行通常标识为 CR LF (carriage return, line feed,回车,换行)。在Unix应用程序中,新行通常标识为 LF。还有一些应用程序只使用CR来表示一个新行。


--------------------------------------------------------------------------------

XML中的注释
在XML中注释的语法基本上和HTML中的一样。

<!-- 这是一个注释 -->


--------------------------------------------------------------------------------

XML并没有什么特别的哦
XML确实没有什么特别的地方。他只是一些用尖括号扩在一起的普通的纯文本。

编辑普通文本的软件也可以编辑XML文档。

然而在一个支持XML的应用程序中,XML标记往往对应着特殊的操作,有些标记可能是可见的,而有些标记则可能不会显示出来,而不会有什么特殊的操作。

XML元素
 
--------------------------------------------------------------------------------

XML元素是可以扩展的,它们之间有关联。

XML元素有简单的命名规则。


--------------------------------------------------------------------------------

XML元素是可以扩展的
XML文档可以被扩展一边携带更多的信息。

请看下面的XML便条例子:

<note>
<to>Lin</to>
<from>Ordm</from>
<body>Don't forget me this weekend!</body>
</note>

让我们来设想一个能够读取此XML文档的并能解读其中XML元素(<to>, <from>, 和<body>)的软件,可能的输出如下:

MESSAGE
To: Lin
From: Ordm

Don't forget me this weekend!
 

我们再来设想,如果便条的作者Ordm在这个XML文档中加入一些额外的信息,如下所示:

<note>
<date>2002-12-24</date>
<to>Lin</to>
<from>Ordm</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>

那么原来的应用程序会中断或者崩溃么?

不会。应用程序仍然会正确的解读<to>, <from>, 和<body> 等元素,并且产生同样的输出。

XML文档是可以扩展的!


--------------------------------------------------------------------------------

XML元素是相互关联的
XML元素之间是父元素和子元素的关系。

为了更好的理解XML术语,必须了解XML元素之间的关系如何,以及元素的内容是如何被描述的。

设想有这样一本书:

署名: XML 指南

第一章: XML入门简介

什么是HTML
什么是XML
第二章: XML语法

XML元素必须有结束标记
XML元素必须正确的嵌套
 

我们可以用XML文档来描述这本书:

<book>
<title>XML 指南</title>
<prod id="33-657" media="paper"></prod><chapter>XML入门简介
<para>什么是HTML</para>
<para>什么是XML</para>
</chapter>
<chapter>XML语法
<para>XML元素必须有结束标记</para>
<para>XML元素必须正确的嵌套</para>
</chapter>
</book>

在上面的代码中,Book元素是XML文档的根元素,title元素和chapter元素是book元素的子元素。Book元素是title元素和chapter元素的父元素。title元素,prod元素和chapter元素是平级元素,因为他们都有同一个父元素。


--------------------------------------------------------------------------------

XML元素的内容
XML元素有不同的内容。

XML元素指的是从该元素的开始标记到结束标记之间的这部分内容。

XML元素有元素内容,混合内容,简单内容或者空内容。每个元素都可以拥有自己的属性。

在上面的例子中,book元素有元素内容,应为book元素包含了其它的元素。Chapter元素有混合内容,因为它里面包含了文本和其他元素。para元素有简单的内容,因为它里面仅有简单的文本。prod元素有空内容,因为他不携带任何信息。

在上面的例子中,只有prod元素有属性,id属性值是33-657,media属性值是paper。


--------------------------------------------------------------------------------

XML元素命名
XML元素命名必须遵守下面的规则:

元素的名字可以包含子母,数字和其他字符。
元素的名字不能以数字或者标点符号开头。
元素的名字不能以XML(或者xml,Xml,xMl...)开头。
元素的名字不能包含空格。
自己“发明”的XML元素还必须注意下面一些简单的规则:

任何的名字都可以使用,没有保留字(除了XML),但是应该使元素的名字具有可读性,名字使用下划线是一个不错的选择。

例如: <first_name>, <last_name>.

尽量避免使用“-”,“.”,因为有可能引起混乱。

只要你愿意元素的名字可以很长,但也不要太夸张了哦。命名应该遵循简单易读的原则,例如:<book_title>是一个不错的名字,而<the_title_of_the_book>则显得罗嗦了。

XML文档往往都对应着数据表,我们应该尽量让数据库中的字段的命名和相应的XML文档中的命名保持一致,这样可以方便数据变换。

非英文/字符/字符串也可以作为XML元素的名字,例如<蓝色理想><经典论坛>这都是完全合法的名字。但是有一些软件不能很好的支持这种命名,所以尽量使用英文字母来命名。

在XML元素命名中不要使用":",因为XML命名空间需要用到这个十分特殊的字符。

XML 属性
 
--------------------------------------------------------------------------------

跟HTML一样,XML元素再开始标记处可以由元素属性。

属性通常包含一些关于元素的额外信息。


--------------------------------------------------------------------------------

XML属性
XML元素可以拥有属性。

你一定还记得这样的HTML代码吧: <IMG SRC="computer.gif">。src是img元素的属性,提供了关于img元素的额外信息。

在HTML中 (在XML中也一样)元素的属性提供了元素的额外信息。

<img src="computer.gif">
<a href="demo.asp">

书信提供的信息通常不是数据的一部分。在下面的例子中,类型和数据毫不相关,但对于操作这个元素的软件来说却相当重要。

<file type="gif">computer.gif</file>


--------------------------------------------------------------------------------

引用风格"female" 还是 'female'?
属性值必须用引号引着。单引号、双引号都可以使用。例如一个人的性别,person元素可以这样写:

<person sex="female">

也可以这样写:

<person sex='female'>

上面的两种写法在一般情况下是没有区别的,使用双引号的应用更普遍一些。但是在某些特殊的情况下就必须使用单引号,比如下面的例子:

<gangster name='George "Shotgun" Ziegler'>
 
--------------------------------------------------------------------------------

使用子元素还是使用属性
数据既可以存储在子元素中也可以存储在属性中。

请看下面的例子:

<person sex="female">
<firstname>Anna</firstname>
<lastname>Smith</lastname>
</person>

<person>
<sex>female</sex>
<firstname>Anna</firstname>
<lastname>Smith</lastname>
</person>

在第一个例子中,sex是一个属性,在第二个例子中,sex则是一个子元素。这两个例子都提供了相同的信息。

什么时候用属性,什么时候用子元素没有一个现成的规则可以遵循。我的经验是属性在HTML中可能相当便利,但在XML中,你最好避免使用。


--------------------------------------------------------------------------------

我喜欢的风格
我更愿意把数据存储到子元素中。

下面的三个XML文档包含了相同的信息:

第一个例子使用了data属性:

<note date="12/11/99">
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>

第二个例子使用了data元素:

<note>
<date>12/11/99</date>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>

第三个例子使用了扩展的data元素: (这就是我推荐的样式):

<note>
<date>
<day>12</day>
<month>11</month>
<year>99</year>
</date>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note> 


--------------------------------------------------------------------------------

避免使用属性?
应该避免使用属性么?

这里有一些使用属性引发的问题:

属性不能包含多个值(子元素可以)。
属性不容易扩展。
属性不能够描述结构(子元素可以)。
属性很难被程序代码处理。
属性值很难通过DTD进行测试。
如果使用属性来存储数据,那么所编写的XML文档一定很难阅读和操作。尽量使用元素来描述数据,仅使用属性来描述那些与数据关系不大的额外信息。

不要象下面的例子那样(如果你那么做了说明你还没有明白上面的观点)。

<note day="12" month="11" year="99"
to="Tove" from="Jani" heading="Reminder"
body="Don't forget me this weekend!">
</note> 


--------------------------------------------------------------------------------

属性规则的例外
规则总是有例外的。

我的关于属性的规则也有一个例外:

有些时候应该为一个元素设计一个ID引用,通过这个ID可以引用存取特定的XML元素,就象HTML中的name和id属性一样。请看下面的例子:

<messages>
<note ID="501">
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
<note ID="502">
<to>Jani</to>
<from>Tove</from>
<heading>Re: Reminder</heading>
<body>I will not!</body>
</note>
</messages>

在上面的例子中,ID属性就相当于一个计数器,或者是一个唯一的标识符,在XML文档中标识不同的便条信息,他不是便条信息的一部分。

我们所要尽力向读者说明的是:元数据(与数据有关的数据)应该以属性的方式存储,而数据本身应该以元素的形式存储。

XML 确认
 
--------------------------------------------------------------------------------

符合语法的XML文档称为结构良好的XML文档。

通过DTD验证的XML文档称为有效的XML文档。


--------------------------------------------------------------------------------

"结构良好的" XML文档
一个结构良好的XML文档应该使用正确的语法。

一个结构良好的XML文档应该遵守XML语法规则,前面一章给出的例子就是一个结构良好的XML文档:

<?xml version="1.0" encoding="ISO-8859-1"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note> 


--------------------------------------------------------------------------------

"有效的" XML文档
一个有效的XML文档应该遵守DTD的描述。

一个有效的XML文档也是一个结构良好的XML文档,同时还必须符合DTD的规则。

<?xml version="1.0" encoding="ISO-8859-1"?>
<!DOCTYPE note SYSTEM "InternalNote.dtd">
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note> 


--------------------------------------------------------------------------------

XML DTD
DTD定义了XML文档中可用的合法元素。

DTD的意图在于定义XML文档的合法建筑模块。他通过定义一系列合法的元素决定了XMl文档的内部结构。结构良好的XML文档不一定是有效的XML文档,但有效的XML文档一定是结构良好的XML文档。如果你想了解更多关于DTD的知识可以参考DTD 指南。


--------------------------------------------------------------------------------

XML Schema 
XML Schema(XML模式)是基于XML的DTD的替代品。

W3C使得DTD和Schema可以相互替代,读者可以在Schema 指南中了解到更多信息。


--------------------------------------------------------------------------------

错误
XML文档中发生的错误将导致XML程序停止。

W3C的XML规范声明:如果程序在处理XML文档中发现一个有效的错误,那么此程序应该终止。这就是XML软件相对于容易编写的原因。所有的XML文档地都应该是协调一致的。

在HTML中,HTML文件可能包含很多错误,(比如一个元素有开始标记没有结束标记)这也是HTML浏览器体积之所以很大的一个原因,当他们发现错误的时候,他们有各自不同的方法来决定此HTML文件应该如何显示。

在XML中决不会发生这种情况。

XML 浏览器(Netscape、Explorer)
 
--------------------------------------------------------------------------------

在我们这个XML指南里,我们把焦点放在Internet Explorer 5.0及其以后的版本上。


--------------------------------------------------------------------------------

Web站点上的XML
许多应用程序都支持XML。我们主要研究Internet Explorer 5.X+

对此有些人可能会抱怨,但是我们只想把事情简单化,在网络环境中这时我们所知道的唯一一个真实测试XML例子的方法。


--------------------------------------------------------------------------------

XML Netscape 6
Netscape 6 支持 XML。

在Netscape 6中察看XML源文件可以在页面上点鼠标右键,然后选择“察看源文件”。


--------------------------------------------------------------------------------

XML Internet Explorer 5.0
IE 5.0 支持 XML 1.0 标准。

Internet Explorer 5.0 支持XML1.0标准和XML DOM(Document Object Model)的国际标准。这些标准都是W3C发布的(World Wide Web Consortium)。

Internet Explorer 5.0 支持下列 XML 特性:

察看XML文档
对W3C DTD标准的完全支持
在HTML页面中以数据岛形式嵌入XML
把XML数据绑定到HTML元素上
使用XSL程序转换和显示XML文档
使用CSS显示XML文档
支持 XML DOM
Internet Explorer 5.0 也支持XML行为(XML Behaviors):

行为是Microsoft独有的技术
行为可以从HTML页面中分离程序脚本
行为可以见数据存储到客户端的硬盘上
在下一章中讲给出一些相关的例子。

如果你想了解更多关于nternet Explorer的信息你可以到W3Schools' Browser Information浏览最新的信息。

察看 XML 文件
 
--------------------------------------------------------------------------------

原始的XML文件可以用IE 5.0 (或者更高的版本)或者Netscape 6来察看,但是如果希望让XML文档象Web页那样显示就必须添加一些额外的显示信息。


--------------------------------------------------------------------------------

察看XML文件
我们可以使用IE5.0 (或者更高的版本)来浏览XML文档。你可以单击一个超链接或者是在浏览器的地址栏中输入URL地址,或者是在文件夹中双击XML文档。如果你用 IE打开XML文档后发现浏览器用带颜色的标识XML文档的根元素和子元素,XML元素的左边有一个"+"号,那么你可以单击这个“+”号,展开这个元素的下一级结构;如果元素的左边有一个"-"号,那么你也可以单击这个“-”号,收拢这个元素的下一级结构,如果你愿意察看XML文档的源文件,那么你可以在右键菜单中选择“察看源文件”。

我们也可以用Netscape 6来打开XML文档,并且也可以用右键选择“察看源文件” 当你用Netscape 6打开XML文档后,浏览器将用带颜色的代码显示根元素和子元素。

我们来看一个XML文件: note.xml

注意:不要指望XML文档可以象HTML文件那样格式化。


--------------------------------------------------------------------------------

浏览不合格的XML文档
如果用IE浏览器打开一个不正确的XML文档,浏览器将会报告错误。

来看下面这个例子: note_error.xml


--------------------------------------------------------------------------------

其它的例子
浏览一些XML文档可以帮助你找到学习XML的感觉。

我们为你收集了一些XML资料:

An XML CD catalog
这是我的父辈的CD收藏纪录,存储成XML数据格式。

An XML plant catalog
这是一个植物商店的植物产品目录,也存储成XML格式了。

A Simple Food Menu
这是一个餐馆的早餐食谱目录,同样也是XML格式的。


--------------------------------------------------------------------------------

为什么XML在浏览器中的显示是这个样子呢?
单纯的XML文档并不包含如何显示数据的信息。

既然XML标记是由XML文档作者“创造”和“发明”的,那么我们不可能知道一个<table>标记是指HTML中的表格还是一个木桌子。

在没有任何额外的信息指示如何显示数据的情况下,IE浏览器一般以树状视图的形式显示XML数据。

在下面的及格小节中,我们将描述一些解决XML文档显示问题的方案,包括CSS, XSL, JavaScript,和XML数据岛。

使用CSS来显示XML
 
--------------------------------------------------------------------------------

使用CSS样式单 (Cascading Style Sheets) ,可以给XML文档添加额外的现实信息。


--------------------------------------------------------------------------------

使用CSS来显示未来的XML文档么?
应该使用CSS来显示你未来的XML文档么?

不,我们不推荐这样做!但是我们还是应该实验一下:

我们先来看一个单纯的XML文档: The CD Catalog

然后我们来看CSS样式表单文件: The CSS file

最后,我们来看用CSS显示出来的XML文档: The CD Catalog formatted with the CSS file

这是用CSS样式单修饰的XML文档的一小部分代码片断:

<?xml version="1.0" encoding="ISO-8859-1"?>
<?xml-stylesheet type="text/css" href="cd_catalog.css"?>
<CATALOG>
<CD>
<TITLE>Empire Burlesque</TITLE>
<ARTIST>Bob Dylan</ARTIST>
<COUNTRY>USA</COUNTRY>
<COMPANY>Columbia</COMPANY>
<PRICE>10.90</PRICE>
<YEAR>1985</YEAR>
</CD>
<CD>
<TITLE>Hide your heart</TITLE>
<ARTIST>Bonnie Tyler</ARTIST>
<COUNTRY>UK</COUNTRY>
<COMPANY>CBS Records</COMPANY>
<PRICE>9.90</PRICE>
<YEAR>1988</YEAR>
</CD>
.
.
.
.
</CATALOG>   

即使使用CSS的显示效果很好,我们不认为使用CSS样式单显示XML文档是未来Web开发的趋势。我们相信,使用XSL程序格式化XML文档将会是未来的趋势,目前最主要的浏览器都支持这种技术。


--------------------------------------------------------------------------------

使用XML创建未来的主页?
你愿意使用XML来创建你未来的网站么?

不,我不认为这是一个好主意。我们也不拒绝去做这样一个尝试:A homepage written in XML.

我们不相信XML会直接用于创建未来的Web页面。

我们仍然相信,XHTML - 利用XML重新定义过的HTML可能是一个更好的选择: 情阅读我们的XHTML 指南 。

使用XSL来显示XML数据
 
--------------------------------------------------------------------------------

使用XSL可以给XML文档添加上显示信息。


--------------------------------------------------------------------------------

使用XSL来显示XML文档
XSL是XML的可扩展样式单语言。

XSL (全称是:可扩展的样式单语言,the eXtensible Stylesheet Language)比CSS样式单功能要强大的多。XSL的一个主要的用途就是将XML文档转换成HTML格式的文件,然后再交付给浏览器,由浏览器显示转换的结果:

如果你有网景6或者IE 5(或者更高的版本),你可以观看the XML file and the XSL style sheet.

在IE6中的显示结果:View the result in IE 6

在IE5中的显示结果:View the result in IE 5

注意下面的代码片断中的第二行:

<?xml version="1.0" encoding="ISO-8859-1"?>
<?xml-stylesheet type="text/xsl" href="simple.xsl"?>
<breakfast_menu>
<food>
<name>Belgian Waffles</name>
<price>$5.95</price>
<description>
two of our famous Belgian Waffles
</description>
<calories>650</calories>
</food>
</breakfast_menu>

如果你想了解更多关于XSL的知识,请阅读我们的XSL 指南。
XML数据岛
 
--------------------------------------------------------------------------------

使用IE5.0或者更高的版本,XML数据可以以数据岛的形式嵌入HTML页面。


--------------------------------------------------------------------------------

在HTML页面中嵌入XML数据
使用非官方标准的<xml>标记可以将XML数据嵌入到HTML页面中。

XML数据可以象下面的例子那样嵌入HTML页面:

<xml id="note">
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
</xml>

或者象下面这样嵌入外部单独的XML文件:

<xml id="note" src="note.xml">
</xml>

注意那个<xml>标记是一个HTML元素,而不是一个XML元素。


--------------------------------------------------------------------------------

数据绑定
XML数据岛可以绑定到HTML元素上(比如表格)。

在下面的例子中,一个XML数据岛(ID=cdcat)被从外部XML文档载入。一个HTML的表格绑定到此数据岛上。HTML表格内部的span元素使用datafld属性和XML文档相应的XML元素相互绑定。

<html>
<body>
<xml id="cdcat" src="cd_catalog.xml"></xml>
<table border="1" datasrc="#cdcat">
<tr>
<td><span datafld="ARTIST"></span></td>
<td><span datafld="TITLE"></span></td>
</tr>
</table>
</body>
</html>

如果你使用的是IE 5.0 或者更高版本, 你可以自己尝试一下try it yourself.

如果你使用的是IE 5.0 或者更高版本,你可以观看external XML file.

同样也可以实验this example, 论证元素<thead>, <tbody>, and <tfoot>.

微软的XML解析器
 
--------------------------------------------------------------------------------

XML解析器可以读取、更新、创建、操作一个XML文档。


--------------------------------------------------------------------------------

使用XML解析器
微软的XML解析器是和IE5.0+浏览器捆绑在一起的。

一旦你安装了IE5.0,那么就获得了XML解析器。这个浏览器除了被浏览器内部调用外,还可以在脚本中或者程序中调用。这个解析器的特点是支持与程序设计语言无关的编程模型,他支持以下技术:

JavaScript, VBScript, Perl, VB, Java, C++ 等等
W3C XML 1.0 和 XML DOM
DTD 和 XML文档验证
如果浏览器使用JavaScript作为脚本语言,那么利用下面的代码可以创建XML文档对象:

var xmlDoc=new ActiveXObject("Microsoft.XMLDOM")

如果浏览器使用VBScript作为脚本语言,那么利用下面的代码可以创建XML文档对象:

set xmlDoc=CreateObject("Microsoft.XMLDOM")

如果在ASP程序中使用VBScript脚本语言,那么就可以使用下面的代码形式:

set xmlDoc=Server.CreateObject("Microsoft.XMLDOM")


--------------------------------------------------------------------------------

将XML文档载入解析器
使用脚本代码可以将XML文档载入解析器。

下面的代码可以将一个XML文档载入解析器:

<script type="text/javascript">
var xmlDoc = new ActiveXObject("Microsoft.XMLDOM")
xmlDoc.async="false"
xmlDoc.load("note.xml")
// ....... processing the document goes here
</script>

第二行代码创建Microsoft XML解析器的实例。

第三行代码关闭异步载入,确保XML解析器在把XML文档完全载入以前不会对XML文档进行解析。

第四行则告诉解析器需要载入的XML文档名字是note.xml。


--------------------------------------------------------------------------------

把纯XML文档由字符载入解析器
解析器可以从一个文本字符串中载入XML文本。

下面的代码演示了将文本字符串载入解析器:

<script type="text/javascript">
var text="<note>"
text=text+"<to>Tove</to><from>Jani</from>"
text=text+"<heading>Reminder</heading>"
text=text+"<body>Don't forget me this weekend!</body>"
text=text+"</note>"
var xmlDoc = new ActiveXObject("Microsoft.XMLDOM")
xmlDoc.async="false"
xmlDoc.loadXML(text)
// ....... processing the document goes here
</script>

注意这里载入字符串使用的是"loadXML()"方法)(而不是前面用过的"load()"方法), "loadXML()"是用于载入字符串,"load()"是用于载入XML文档。


--------------------------------------------------------------------------------

使用JavaScript语言显示XML数据
可以使用JavaScript语言来显示XML数据。

JavaScript (或者 VBScript)可以从XML文档中导入数据,并将这些数据在HTML页面中显示出来。

下面我们来看一下XML和HTML是如何进行相互之间的互补的,首先来看一个XML 文档 (note.xml), 然后我们看一个包含了导入XML文档兵显示在HTML页面中的JavaScript脚本代码的HTML文档(note.htm) 。

去看看他是如何工作的, 自己尝试一下吧 

你可以在我们的DOM School中了解更多的关于JavaScript的知识。

现实生活中的XML
 
--------------------------------------------------------------------------------

XML最现实的一个例子就是装载信息。


--------------------------------------------------------------------------------

实例: XML 新闻
XML新闻是一种交换新闻和其他信息的规范。

使用这样一种规范,使新闻工作制作者和新闻消费者跨越不同的硬件、软件、编程语言来生产、接收、存档各种各样的新闻信息变得更简单快捷。


--------------------------------------------------------------------------------

一个XML新闻文档的例子:
<?xml version="1.0" encoding="ISO-8859-1"?>
<nitf>
<head>
<title>Colombia Earthquake</title>
</head>
<body>
<body.head>
<headline>
<hl1>143 Dead in Colombia Earthquake</hl1>
</headline>
<byline>
<bytag>By Jared Kotler, Associated Press Writer</bytag>
</byline>
<dateline>
<location>Bogota, Colombia</location>
<story.date>Monday January 25 1999 7:28 ET</story.date>
</dateline>
</body.head>
</body>
</nitf>

关于XML新闻更多的信息可以去访问网址: http://www.xmlnews.org/

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值