华恩JAVA班第39天

华恩JAVA班第39天

 

 

XSLT

XSLT是XSL的一部份,它是XML的一种应用,指定将一篇XML文档转换成另一种XML文档的规则。XSLT文档即是一篇XML文档,也是一个样式表,里面包含一系列的模板。XSLT处理器对输入XML文档中的元素和样式表中的模板进行比较,如果匹配,则将该模板的内容写入一个输出树中。完成处理后,将输出树串行化成一篇XML文档或其它格式的文档,如HTML或者rtf。

XSLT几个关键术语

源树,原始文档中的元素和元素内容的树。

结果树,转换之后中文档中的元素和元素内容的树。

模板规则,XSLT样式表的基础,分为模式和模板两部份。整个xsl:template元素。

模式,表示源树中的元素与模式规则匹配的条件集合。xsl:template中的match的值。

模板,表示当应用模板规则时,结果树中要实例化的部份。xsl:template元素中的内容。

XSLT定义了35个元素,分为三类:

两个根元素

xsl:stylesheet根元素,XSLT也是一个XML文档,该文档的根元素就是xsl:stylesheet。XSLT元素都属于名称空间xmlns:xsl="http://www.w3.org/1999/XSL/Transform",所以所有的XSLT元素都有xsl前缀。一个最小化XSLT文档:


http://www.w3.org/1999/XSL/Transform">

xsl:transform元素,作用同上。

13个顶级元素,可直接作为根元素的子元素,包括:

xsl:apply-imports

xsl:attribute-set

xsl:decimal-format

xsl:import

xsl:include

xsl:key

xsl:namespace-alias

xsl:output

xsl:param

xsl:preserve-space

xsl:strip-space

xsl:template模板元素,用于匹配XML文档中的元素。如:,匹配XML文档中的person元素。

xsl:variable

20个指令元素

xsl:apply-imports

xsl:apply-template应用模板元素,用于显示指定的元素值(内容)。如:,显示name元素的值。

xsl:attribute

xsl:call-template

xsl:choose

xsl:comment

xsl:copy

xsl:copy-of

xsl:element

xsl:fallback

xsl:for-each

xsl:if

xsl:message

xsl:number

xsl:otherwise

xsl:processing-instruction

xsl:text

xsl:value-of选择元素,用于计算元素的值(内容)。如:,获得XML文档中name元素的值(内容)。

xsl:variable

xsl:when

 

 


 XPath

XPath是一种用来从文档树中选择节点和节点集的语言。从XPath的角度来看,共有七种节点:

根节点

元素节点

属性节点

文本节点

注释节点

处理指令节点

名称空间节点

CDATA部份,实体引用和文档类型声明不包括在内,XPath在所有这些项都并入文档之后才起作用。根节点和根元素是不同的两个概念,根节点包含整篇文档,包括根元素。

6.3.1. 匹配模式

匹配模板的通用模式

Table 6.1.

模式 描述
match="E" 匹配元素E
match="*" 匹配任意元素
match="E|F" 匹配元素E和F
match="E/F" 匹配以E为父元素的元素F
match="E//F" 匹配以E为根元素的元素F
match="/" 匹配根节点
match="text()" 匹配文本节点
match="comment()" 匹配注释节点
match="processing-instruction()" 匹配处理指令
match="node()" 匹配除属性节点和根节点外的节点
match="id(test)" 匹配具有唯一ID test的元素
match="E[@CLASS="foo"] 匹配元素E,其类属性为foo
match="E[F]" 匹配元素包含有F元素的E元素

 XPath轴

XPath提供了选择节点的机制,两个较有用的是轴选择和谓语选择,轴指定上下文节点和要选择的节点的关系。共有十三种轴,最常用的有四种,分别是子轴(child)、属性轴(attribute)、自已(self)、双亲(parent)。

Table 6.2. XPath轴描述

轴 描述
child 包含当前节点的儿子
descendent 包含当前节点的后代,后代不包含属性(attribute)或名称域(namespace)节点
parent 包含当前节点的父亲
ancestor 包含当前节点的祖先,祖先总是包含根节点
following-sibling 包含当前节点随后的所有节点树,但不包含attribute或namespace节点
preceding-sibling 包含当前节点之前的所有节点树,但不包含attribute或namespace节点
following 包含当前节点随后的所有节点,following轴排除了当前节点的后代和attribute或namespace节点
preceding 包含当前节点之前的所有节点,following轴排除了当前节点的后代和attribute或namespace节点
attribute 包含当前节点的所有属性
namespace 包含当前节点的所有namespace节点
self 只包含当前节点
descendent-or-self 包含当前节点和当前节点的后代
ancestor-or-self 包含当前节点和当前节点的祖先

谓词

XPath表达式可以匹配多个节点,如需对匹配的节点进行进一步的筛选,可以使用谓词。

Table 6.3. 选择节点常用谓词

谓词 描述
select="E" 选择是当前节点的孩子的E元素
select="" 选择当前节点的孩子的所有元素
select="text()" 选择当前节点的文本节点孩子
select="@name" 选择当前节点的name属性
select="@*" 选择当前节点的所有属性
select="E[1]" 选择当前节点的孩子的第一个E元素
select="E[last()]" 选择当前节点的孩子的最后一个E元素
select="*/E" 选择当前节点的孙了的所有E元素
select="E//F" 选择从当前节点的孩子的E元素派生而来的元素F
select="//" 选择根元素
select="//E" 选择从根节点派生而来的E元素
select="//E/F" 选择所有是从根节点派生而来的E元素的孩子的F元素
select="." 选择当前节点
select=".//E" 选择从当前节点派生而来的所有E元素
select=".." 选择当前节点的父节点
select="../@name选择当前节点的父节点的name属性
select="E[@name='foo']" 选择所有是当前节点的孩子,并且其name属性具有foo值的E属性,除等号外,还可用<,>,<=,>=和!=
select="E[@foo and @bar]" 选择所有包含foo和bar属性的E元素
home/person/@id这种定位路径的写法叫简写定位路径,该写法简洁,容易理解,是XSLT匹配模式中最常用的写法。还有一种称为非简写定位路径的写法,它把节点测试和轴结合在一起,如child::home/child::person/attribute::id。该写法在实际使用中不常用,但它具有非常重要的性能因此有必要了解。


XPath表达式

位置路径是XPath的一个最常用的表达式,用以标识XML文档的节点集。除此之上,XPath表达式还可返回数字、布尔和字符串。非节点集的XPath表达式不能用于xsl:template元素的match属性中。它们用于xsl:value-of元素的select属性值或用于位置路径的谓词中。

每个XPath位置路径可分为一步名多步,每步以“/”号分隔,如:

room[\@name=$root]/date[year=$year and month=$month]/meeting
上下文节点即当前正在处理的节点,也就是位置路径定位的当前节点。上下文在XPath表达式计算前被创建,由XSLT处理器创建。处理每一步后,上下文都会改变。

位置路径中的步可分为三部份:轴(axis)、节点测试(note test)和谓词(predicate),它的写法如下:

axis::note-test[predicate]
轴和节点测试之间用“::”分开,每个谓词由括号[]括起来。

要设计好一个位置路径,需确保在每一步选择最少的节点,使用最严格的轴,用最严格的节点测试。避免使用谓词,因为由轴和节点测试选择的节点集的每个节点都会用作谓词的上下文节点。对于位置路径的三步,最节省的是节点测试。

XPath中的所有数字都是8个字节的IEEE754浮点双精度类型,与java的double类型相同。可表示正无穷大、负无穷大和NaN(零除零)值。支持五种运算符,分别是加(+)、减(-)、乘(*)、除(div)、取余(mod)。

XPath中的字符串是Unicode字符,用单引号或双引号定界。可以使用=和!=对字符进行比较,也可用<,>,<=,>关系运算符,但比较的两个字符必须是数字,否则比较结果没有意义。

XPath中的布尔值常用于位置路径的谓词中,如/person[name="debian"]。布尔值还常用于xsl:if和xsl:when元素的test属性中。如:


  
     
  

XPath函数

XPath还提供很多函数,用于表达式和谓词。XPath函数的返回值有四种类型,分别是:

布尔值,如:true()返回ture(真),false()返回false(假),not()对布尔值取反。

数字,如:number()把任意类型转化数字,celing()返回大于或等于参数的最小整数。

节点集,如:position()返回当有节点在上下节点列表中的位置,count()可统计节点数。

字符串,如:string()转化任意类型为字符串,string-length()返回字符串长度。

 

更多信息可以参见同学富晓磊的博客:http://blog.sina.com.cn/u/1798827371

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值