xml与xsl的转换

xml文档的一大特点是可以向多种格式的文档进行转换。比如,从一种逻辑结构的xml向另一种逻辑结构的xml转换,或是转换为可浏览的html文档等。这种xml文档的数据格式转换功能由可扩展样式单语言(xsl)完成。 




--------------------------------------------------------------------------------


一、xml文档转换原理 
数据格式转换的重要思想是要把xml文档视为一种树结构,转换的过程就是从源树生成结果树的过程。xsl样式单定义了源树和结果树中对应部分的转换规则,每条规则中包含了一个模板,并对应着一种模式。模板定义了转换的结果,而模式则规定了需要进行转换的元素或属性对象。 
xml中引用xsl的语法格式如下: 
<?xml-stylesheet type=“text/xsl” href=“employees.xsl” ?> 
如果在声明部分引用了多个xsl样式单,则只有第一个样式单会生效,其余的都会被忽略掉。 
xsl的格式转换功能在复杂的电子商务解决方案中大有用武之地。比如,a公司和b公司都是生产机器零件的厂家,在货物清单中都包含了产品序列号以及质量等级评分。a公司的文件格式如下: 
<order> 
<orderitem> 
<itemid>12980-235</itemid> 
<quantity>200</quantity> 
</orderitem> 
</order> 
而b公司的文件格式有所不同,相关信息都出现在元素的属性中: 
<order> 
<orderline partno=“12980-235” numrequired=“200”/> 
</order> 
这样,虽然两个公司的产品完全一样,但由于文档格式的差异给双方的贸易往来设置了障碍。而使用xsl样式单可以轻松地把a公司的文档转换成b公司的格式,反之亦然。 
二、xml文档转换步骤 
xml文档的转换过程分为两步: 
● 首先是根据xml文档构造源树,然后根据xsl规则将源树转换为结果树。目前,这种转换协议已经日趋完善,并从xsl中独立出来,成为w3c正式推荐的标准,称为xslt(xsl transformations); 
● 生成结果树后,就可以对其进行解释,产生一种适合显示、打印或是播放的格式,这一步称为格式化(formatting)。  
xsl处理器负责实现转换过程。首先,xml文档被解析成dom树存放在内存中,接着对文档进行分析,每一个dom树中的节点都会与一个模式相比较,当二者匹配时,就会按照模板中定义的规则进行转换,否则继续往下匹配。如此循环,直至整个文档处理完毕。 
三、xsl文档标准格式 
xsl文档的标准格式如下: 
<xsl:stylesheet xmlns:xsl=“http://www.w3.org/tr/wd-xsl”> 
template rule i 
output template 
</xsl:stylesheet> 
xsl文档本身是格式良好的xml文档,所以在书写时要注意标签的匹配问题。<xsl:stylesheet>既是xsl的声明语句,也是根元素,必须位于文件的首部。通常也要利用xmlns属性指明xsl的名称空间。样式单中所有的模板规则都由标签<xsl:temlplate>标明。模板规则可以说明处理的对象(元素/属性)、处理的方式或是转换的结果。此时,我们可以把该标签类似地理解为编程语言中函数的概念。 
四、xsl的语法结构 
xsl的逻辑语法结构包括循环和条件判断。这两种结构使用户能够灵活地书写转换规则。循环判断是通过<xsl:for-each>元素实现的,它的可选属性包括select和order-by。循环结构能够遍历整个结果集合,而不必针对每一条结果都单独书写转换规则。它的标准语法格式为: 
<xsl:for-each select=“pattern” order-by=“patternlist”> 
...... 
</xsl:for-each> 
条件判断结构分为if语句和case语句两种形式。if语句是简单地对条件进行判断,结果为真就执行条件内部的规则,因此可以把if条件与简单的布尔表达式联合使用。下面这个例子就是对薪水超过100万元的职员输出“overpaid employee”信息: 
<xsl:if match=“.[salary $gt$ 1000000]”> 
overpaid employee 
</xsl:if> 
case语句是对多种情况的分支判断。该语句包括<xsl:choose>、<xsl:when>和<xsl:otherwise>三个元素。下面的例子是对薪水不足1万元的职员输出“no tax”,对超过5万元的职员输出“high tax rate”,对介于其间的职员输出“normal tax rate”信息: 
<xsl:choose> 
<xsl:when match=“.[salary $lt$ 10000]”>  
no tax </xsl:when> 
<xsl:when match=“.[salary $gt$ 50000]”>  
high tax rate </xsl:when> 
<xsl:otherwise> normal tax rate </xsl:otherwise> 
</xsl:choose> 
五、xsl的模板规则 
<xsl:template>标签内的文本内容描述了转换结果的形式,称为输出模板。属性match的取值把模板规则与指定的元素或属性相比较,只有匹配的dom节点才会被处理,其余的节点将被忽略。整个过程中最先匹配的是树的根节点,根节点用“/”表示: 
<xsl:template match=“/”> 
output template for root element 
</xsl:template> 
然后匹配其他节点,此时,只要在引号中指明要处理的元素对象名称即可。如果在引号中出现的是“*”,那么表示该规则适用于所有的未单独指定处理的元素节点。比如下例中的第二个模板就表示要处理除<employee>元素之外的所有节点: 
<xsl:template match=“employee”> 
output template 
</xsl:template> 
   
<xsl:template match=“*”> 
output template 
</xsl:template> 
此外,xsl中还可以使用路径指示符来指定一些特殊位置的元素与模板相匹配。“//”代表任意深度位置,如<xsl:template match=“//employee”>用来匹配文档中任何位置的<employee>元素;而如果是<xsl:template match=“employee//name”>,则表明是匹配<employee>元素的后继节点中所有<name>元素。另外一个路径指示符是“/”,表示直接的父子节点关系。将刚才例子中的“//”换为“/”,就意味着匹配的是<employee>元素子节点中的<name>元素。 
很显然,某些树节点在xsl中可能会对应多个模板,在这种情况下,只有最后一个对应模板会生效,前面的模板规则都会被xsl处理器忽略掉。 
一、xsl模板的使用 
xsl在输出模板中描述输出格式,这些格式可以是各种字符串、标签符号、节点值或者是一些xsl语法结构,如条件判断、循环处理等。在许多应用场合中,输出模板中需要使用节点的取值,此时可以根据需要使用<xsl:value-of>元素输出节点值,最直接的使用方式是<xsl:value-of />,这样可以输出当前节点及其所有后继节点的取值。而如果仅仅是想输出指定节点的取值,可以利用select属性进行限定(select属性可以是任意合法的路径表达式): 
<xsl:value-of select = “name” /> 
<xsl:value-of select = “//employee” /> 
上述第一个表达式匹配的对象是当前节点的所有子节点中名称为<name>的元素,第二个表达式匹配的对象则是当前节点中所有后继节点中名为<employee>的元素。注意: 在xsl样式单中必须有一个模板规则与根元素相匹配。 
在确定了模板规则与元素相匹配之后,就可以激活模板,这项任务由<xsl:apply-templates>元素完成。它和<xsl:templates>元素相结合就如同编程中的函数调用:前者是调用指令,而后者就是函数体。对于不同的元素需要调用不同的模板进行处理。为了激活样式单中的模板规则,要在根元素模板规则中使用<xsl:apply-templates>元素,这样就会层层作用使整个样式单文件生效: 
<xsl:template match=“/”> 
<xsl:apply-templates /></xsl:template> 
直接使用<xsl:apply-templates>元素表示不加区分地对当前节点的所有子节点应用模板,而在select属性中书写匹配式则能够限定作用对象: 
<xsl:stylesheet xmlns:xsl=“http://www.w3.org/tr/wd-xsl”> 
<xsl:template match=“/”> 
<xsl:apply-templates select=“//employee” /> 
</xsl:template> 
<xsl:template match=“employee”><p>  
<xsl:apply-templates select=“name” /> 
<xsl:apply-templates select=“salary” /> 
</p></xsl:template> 
<xsl:template match=“name”> 
<span style=“font-size:36pt”> 
<xsl:value-of /> </span></xsl:template> 
<xsl:template match=“salary”> 
<i><xsl:value-of /></i></xsl:template> 
</xsl:stylesheet> 
上述第一个模板与xml文档的根元素相匹配,并对根节点以下的所有<employee>元素应用模板规则。然后,一旦遇到<employee>标签,就插入一个<p>标签作为空白段落,接着对<name>元素和<salary>元素分别应用模板规则。最后,经过转换显示的结果是36磅字体的职员名字和用斜体字表示的职员薪水。 
二、xsl的扩展规则 
1. 路径指示符 
除了前面介绍的“//”和“/”路径指示符,以及统配符“*”,还有几个符号可以用来对模板的匹配对象进行限制: 
● 当前节点指示符为“.”; 
● 父节点指示符为“..”; 
● 属性指示符为“@”。 
上述“@”表示对指定元素中的某个属性进行匹配,如<xsl:apply-templates select=“employee/@id” />语句表示对<employee>元素中的<id>属性应用模板规则。 
2. 过滤匹配符 
除了路径指示符之外,还可以对作用对象进行条件过滤或是排序,以进一步调整应用效果。过滤时,一般是以子元素(或属性)是否存在(或其取值)为标准: 
● 子元素存在:即//employee[salary]存在,选择含有<salary>子元素的所有<employee>元素; 
● 子元素取值:即employee[salary > 25000],选择含有<salary>子元素,且salary取值大于25000的所有<employee>元素; 
● 属性存在: 即employee[@id]存在,选择含有<id>属性的<employee>元素; 
● 属性取值: 即employee[@id =“1234”],选择所有属性id值为1234的<employee>元素。 
3. 其他扩展过滤 
其他的一些附加功能的过滤符,按功能分为:比较操作符、布尔操作符和集合索引。 
比较操作符的书写格式和功能如下所示: 
操作符 功能 
$eq$ 等于 
$ne$ 不等 
$lt$ 小于 
$le$ 小于或等于 
$gt$ 大于 
$ge$ 大于或等于 

需要说明的是:表格中的操作符在比较字符时对大小写是敏感的,如果要忽略大小写的不同含义,在每个操作符前面加上前缀字母“i”即可,如“$ieq”。 
布尔操作符书写格式和功能说明如下: 
操作符 功能 
$and$ 逻辑与 
$or$ 逻辑或 
$not$ 取非 

对过滤的结果可以通过集合索引进行再过滤。例如,employee[salary][2]就是选择第2个含有<salary>子元素的所有<employee>元素。此外,xsl还提供了集合索引函数供用户使用:index方法表示过滤结果的索引号,end方法表示最后一个过滤结果。使用方法如下所示: 
employee[index() $lt$ 2] 
employee[end()] 
上述第一个表达式的选择结果是<employee>元素的第1和第2个子元素,第二个表达式的选择结果是<employee>元素的最后一个子元素。在缺省状态下,模板规则对元素的匹配顺序是按照节点在xml文档中出现的前后次序排定的。但在特定的应用场合中,可能需要对原有的顺序进行调整,此时需要使用order-by属性。使用方法如下所示: 
<xsl:apply-templates select=“//employee” order-by=“+name”/> 
<xsl:apply-templates select=“//employee”  
order-by=“number(salary)”/> 
上述第一个例子表示应按姓名的字母升序排列,比如“bob”应当排在“tom”之前,而第二个例子则表示按照薪水的多少对职员进行排序。 

文章整理:西部数码--专业提供域名注册虚拟主机服务
http://www.west.cn
以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
可以使用 Go 语言中的 `github.com/lestrrat-go/libxml2/xslt` 包来实现 XSL 转换。这个包是 `libxml2` 库的 Go 语言绑定,可以用来解析和转换 XML 文件。 以下是一个简单的示例,演示如何使用 `xslt` 包将一个 XML 文件转换为 HTML 格式: ```go package main import ( "fmt" "os" xslt "github.com/lestrrat-go/libxml2/xslt" ) func main() { // 打开 XSL 文件 xslFile, err := os.Open("style.xsl") if err != nil { panic(err) } defer xslFile.Close() // 打开 XML 文件 xmlFile, err := os.Open("input.xml") if err != nil { panic(err) } defer xmlFile.Close() // 创建 XSLT 转换xsltProcessor, err := xslt.ParseStylesheet(xslFile) if err != nil { panic(err) } defer xsltProcessor.Free() // 创建 XML 文档对象 xmlDoc, err := xslt.ParseXMLReader(xmlFile) if err != nil { panic(err) } defer xmlDoc.Free() // 执行转换 htmlDoc, err := xsltProcessor.Apply(xmlDoc) if err != nil { panic(err) } defer htmlDoc.Free() // 输出转换后的 HTML fmt.Println(htmlDoc.String()) } ``` 其中,`style.xsl` 是 XSL 文件,`input.xml` 是待转换XML 文件。在代码中,我们首先打开这两个文件,然后分别使用 `xslt.ParseStylesheet` 和 `xslt.ParseXMLReader` 函数创建 XSLT 转换器和 XML 文档对象。接着,我们将 XML 文档对象传递给 XSLT 转换器的 `Apply` 方法,执行转换操作。最后,我们可以通过调用 `htmlDoc.String()` 方法来获取转换后的 HTML 字符串,并输出它。 请注意,本示例仅用于演示基本的 XSL 转换流程。在实际应用中,您可能需要根据具体需求进行更复杂的 XSLT 转换操作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值