xml学习（1）

最新推荐文章于 2022-11-21 11:06:58 发布

b0207191

最新推荐文章于 2022-11-21 11:06:58 发布

阅读量252

点赞数

HTML将数据内容与表现融为一体，可修改性、数据可检索性差，而XML借鉴了HTML与数据库、程序语言的优点，将内容与表现分开，不仅使检索更为方便，更主要的是用户之间数据的交换更加方便，可重用性更强。 XML是一种元标记语言，没有许多固定的标记，为WEB开发人员提供了更大的灵活性。当我们使用HTML时，标记只是简单的表示内容的显示形式，而与表示的内容没有任何关联，为文档的进一步处理带来极大的不便。比如要表示个人简历，用HTML的表示方式如下：

<HTML>
<BODY>
<TABLE border=1 cellspacing=0>
<TH>姓名<TD>禹希初<TH>性别<TD>男<TH>生日<TD>1977.5<TR>
<TH>技能<TD colspan=5>数据库设计与维护、WEB开发
</TABLE>
</BODY>
</HTML>

姓名	禹希初	性别	男	生日	1977.5
技能	数据库设计与维护、WEB开发

上例在浏览器中的样子

　　在这里，我们无法从标记TH、TD得知其内容表示什么，如果用XML，相应的文档（文件名：个人简历.xml）就可写成如下形式：

<?xml version="1.0" encoding="GB2312"?>
<resume>
<name>禹希初</name>
<sex>男</sex>
<birthday>1977.5</birthday>
<skill>数据库设计与维护、WEB开发</skill>
</resume>

上例在浏览器中的样子(IE5.0或更新版本)

说明：

　　version──规定了XML文档的版本，此处只能是1.0；

　　encoding── 此处规定了XML文档的编码类型，此处取值为"GB2312"，也就是"简体中文"。

　　对比两例，使用XML我们可以做到自定义标记，用标记表明内容的含义。这样在Internet上交流资料时，为用计算机处理文档提供了极大的方便，同时我们阅读源文件时也不会被一大堆格式弄得晕头转向。

　　然而，由于XML并没有为标记规定显示方式，如果我们在游览器中查看以上两个文档（建议使用IE5.0或更新版本），我们将看到xml文档并没有以诸如表格的方式来显示。难道我们就不能像HTML一样显示文档吗？回答是否定的。以个人简历为例，需要另建一个格式文件说明各个标记的显示方式，其内容如下（假设文件名为resume.css）：

resume{ display: block;}
name{ display: block; font-size:120%;}
sex{ display:block; text-indent:2em}
birthday{ display:block; text-indent:2em}
skill{ display:block; text-indent:2em}

说明：

　　以上均为CSS样式，建议读者参考有关资料熟悉CSS，在以后学习中必须用到，此处由于篇幅关系不作介绍。建立文件resume.css后，在个人简历.xml文件的第一行后添加以下文字：

<?xml:stylesheet type="text/css" href="resume.css"?>

上例在浏览器中的样子(IE5.0或更新版本)

说明：

　　此处表示引用一个外部CSS样式文件，其中type规定样式类型（可取值为text/css或text/xsl），href规定文件路径。

　　1. 为了更好的理解与掌握XML，建议熟悉HTML 4.0与CSS 2.0语法；掌握JavaScript、VBscript中至少一种

　　2. XML文档中标记必须成对出现，如果是空标记也必须有前加"/"的同名标记结束，或使用此种文式<xml_mark/>表示空标记。

　　3. XML以及XSL文档，属性值必须用双引号（"）或单引号（’）括起来。

　　4. XML文档必须是良构的，也就是说标记必须有结束标记、标记可以嵌套但不可交叉，如：

是合法的，而下面的形式

则是错误的。如果XML文档在浏览时出错，多半是违反了上面提到的规则。

上期我们讲到用CSS（层叠样式表）来格式化XML文档，其效果并不很令人满意。实际上CSS用来格式化HTML标记比较合适些，只是因为它简单才在上例中采用。

　　XML在更多的时候只是一种数据文件，怎样将它变为我们日常所看到的HTML格式那样的文件呢？如果我们将XML文件比作结构化的原料的话，那么XSL就好像"筛子"与"模子"，筛子选取自己需要的原料，这些原料再通过模子形成最终的产品：HTML。
　　这个模子大致是这样：我们先设计好表现的页面，再将其中需要从XML中获取数据来填充内容的部分"挖掉"，然后用XSL语句从XML中筛出相关的数据来填充。一言以譬之：这XSL实际上就是HTML的一个"壳子"，XML数据利用这个"壳"来生成"传统"的HTML。
　　XML在展开时是一个树形结构，我们将树形结构中自定义标记称为节点，节点之间存在父子、兄弟关系，我们要访问其中的结点从根结点就要以"／"来层层进入。
　　在XSL这个壳中，我们要从原料库XML里提取相关的数据，就要用到XSL提供的模式化查询语言。所谓模式化查询语言，就是通过相关的模式匹配规则表达式从XML里提取数据的特定语句，即我们上面所说的"筛子"。

　　参考微软的"XSL开发者指南"，我们大致可将模式语言分为三种：

　　选择模式：
<xsl:for-each>、<xsl:value-of>和 <xsl:apply-templates>

　　测试模式：
<xsl:if> 和<xsl:when>

匹配模式：
<xsl:template>
　　我们现在就分别对之进行介绍。
　　一、选择模式
　　选择模式语句将数据从XML中提取出来，是一种简单获得数据的方法，这几个标记都有一个select属性，选取XML中特定的结点名的数据。
　　1、<xsl:for-each>
　　如在XML中有这样的数据:
<author>
<name>小禹</name>
<name>春华</name>
<name>秋实</name>
</author>
　　我们要读取这三个作者名字，是一个一个地按"author/name"方法来读取吗，可有多个这样的name呀？如果有一种程序性的语句来循环读取有多好啊！
　　想得很对，XSL提供了这样的具有程序语言性质的语句：<xsl:for-each>
　　用它读取这三个作者名字的方法如下:
<xsl:for-each select="author/name">
……
</xsl:for-each>
　　select，顾名思义，选取，它可以选定XML中特定唯一的标记，也可以选择某一类相同的标记，我们称之为结点集。
　　语法：
<xsl:for-each select="pattern" order-by="sort-criteria-list">
　　属性：
　　1.select
　　根据XSL样式查询考察上下文以决定哪类结点集（满足select条件）使用此样式描述。作为一种简化的表示就是，如果你想对文档中的某一种标记的内容的显示方式进行格式化，就可以将让select等于此元素的标记名。例如欲对标记xml_mark进行格式化，即可用如下方式表示：
<xsl:for-each select="xml_mark">

</xsl:for-each>
　　2.order-by
　　以分号（;）分隔、作为排序标准的列表。在列表元素前添加加号（+）表示按此标记的内容以升序排序，添加减号（-）表示逆序排序。作为一种简化的表示就是，排序标准列表就是由select规定的标记的子标记的序列，每个标记之间以（;）分隔。

　　2、<xsl:value-of>
　　<xsl:for-each>模式只是选取节点，并没有取出节点的值，好比猴子只是爬到了树的某个枝干上，那么就用< xsl:value-of >来摘"胜利果实"吧！
　　语法：
<xsl:value-of select="pattern">提取节点的值
　　属性：
　　select用来与当前上下文匹配的XSL式样。简单的讲，如果要在XSL文档某处插入某个XML标记（假定是xml_mark标记）的内容，可用如下方式表示：
<xsl:value-of select="xml_mark"></xsl:value-of>
　　或
<xsl:value-of select="xml_mark"/>
示例：
　　此处仍以上期的个人简历的作为例子，我们需要对文件（个人简历.xml）作一定修改，确切的说是将其中的第二行：
<?xml:stylesheet type="text/css" href="resume.css"?>
　　修改为：
<?xml:stylesheet type="text/xsl" href="resume.xsl"?>
　　然后建立一个新文件：resume.xsl，其内容如下：
<?xml version="1.0" encoding="GB2312"?>
<HTML xmlns:xsl="http://www.w3.org/TR/WD-xsl">
<HEAD>
<TITLE>个人简历</TITLE>
</HEAD><BODY>
<xsl:for-each select="resume">
<P/>
<TABLE border="1" cellspacing="0">
<CAPTION style="font-size: 150%; font-weight: bold">
个人简历
</CAPTION>
<TR>
<TH>姓名</TH><TD><xsl:value-of select="name"/></TD>
<TH>性别</TH><TD><xsl:value-of select="sex"/></TD>
<TH>生日</TH><TD><xsl:value-of select="birthday"/></TD>
</TR>
<TR>
<TH>技能</TH><TD colspan="5"><xsl:value-of select="skill"/></TD>
</TR>
</TABLE>
</xsl:for-each>
</BODY>
</HTML>

上例在浏览器中的样子(IE5.0或更新版本)

现在我们对文件（个人简历.xml）作进一步的修改：
　　1.在标记<resume>前添加一个新标记<document>；
　　2.将标记对<resume></resume>之间的内容（包括这一对标记）复制并粘贴在其后，并在最后用<document>结束。
　　3.以Notepad.exe打开文件resume.xsl，在标记<HTML>之后添加文字：<xsl:for-each select="document">；在标记</HTML>之前添加文字：</xsl:for-each>，保存文件。
　　4.在浏览器中打开文件（个人简历.xml）。看到了什么？两份个人简历！

上例在浏览器中的样子(IE5.0或更新版本)

就这样，利用XML我们可以编写内容与样式完成分离的文档！当然，XSL文件比一般的HTML文件要复杂一些，然而一旦完成则可用于格式化所有同类的XML文档。我们学习了XHTML文档的编写和以及三个XSL元素，已能编写相当灵活的XSL文档，今天将学习的是XSL模板的编写。我们都知道，短的文档、程序十分好读，但当规模增大后，其复杂性也以更快的速度增加。