xpath

最新推荐文章于 2024-03-28 11:14:34 发布

ALENTAM

最新推荐文章于 2024-03-28 11:14:34 发布

阅读量728

点赞数

分类专栏： XML 文章标签：文档 xml div encoding c

XML 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一

一、基本的XPath语法类似于在一个文件系统中定位文件,如果路径以斜线 / 开始, 那么该路径就表示到一个元素的绝对路径。

/AAA
选择根元素AAA

/AAA/CCC
选择AAA的所有CCC子元素

/AAA/DDD/BBB
选择AAA的子元素DDD的所有子元素

二、如果路径以双斜线 // 开头, 则表示选择文档中所有满足双斜线//之后规则的元素(无论层级关系)。

//BBB
选择所有BBB元素

//DDD/BBB
选择所有父元素是DDD的BBB元素

三、星号 * 表示选择所有由星号之前的路径所定位的元素。

/AAA/CCC/DDD/*
选择所有路径依附于/AAA/CCC/DDD的元素

/*/*/*/BBB
选择所有的有3个祖先元素的BBB元素

//*
选择所有元素

四、方块号里的表达式可以进一步的指定元素, 其中数字表示元素在选择集里的位置, 而last()函数则表示选择集中的最后一个元素。

/AAA/BBB[1]
选择AAA的第一个BBB子元素

/AAA/BBB[last()]
选择AAA的最后一个BBB子元素

五、属性通过前缀 @ 来指定。

//@id
选择所有的id属性

//BBB[@id]
选择有id属性的BBB元素

//BBB[@name]
选择有name属性的BBB元素

//BBB[@*]
选择有任意属性的BBB元素

//BBB[not(@*)]
选择没有属性的BBB元素

六、属性的值可以被用来作为选择的准则, normalize-space函数删除了前部和尾部的空格, 并且把连续的空格串替换为一个单一的空格。

//BBB[@id='b1']
选择含有属性id且其值为'b1'的BBB元素

//BBB[normalize-space(@name)='bbb']
选择含有属性name且其值(在用normalize-space函数去掉前后空格后)为'bbb'的BBB元素

七、count()函数可以计数所选元素的个数。

//*[count(BBB)=2]
选择含有2个BBB子元素的元素

//*[count(*)=2]
选择含有2个子元素的元素

八、name()函数返回元素的名称, start-with()函数在该函数的第一个参数字符串是以第二个参数字符开始的情况返回true, contains()函数当其第一个字符串参数包含有第二个字符串参数时返回true。

//*[name()='BBB']
选择所有名称为BBB的元素(这里等价于//BBB)

//*[starts-with(name(),'B')]
选择所有名称以"B"起始的元素

//*[contains(name(),'C')]
选择所有名称包含"C"的元素

九、string-length函数返回字符串的字符数,你应该用<替代<, 用>代替>。

//*[string-length(name()) = 3]
选择名字长度为3的元素

//*[string-length(name()) < 3]
选择名字长度小于3的元素

//*[string-length(name()) > 3]
选择名字长度大于3的元素

十、多个路径可以用分隔符 | 合并在一起，可以合并的路径数目没有限制

//CCC | //BBB
选择所有的CCC和BBB元素

/AAA/EEE | //BBB
选择所有的BBB元素和所有是AAA的子元素的EEE元素

十一、child轴(axis)包含上下文节点的子元素, 作为默认的轴,可以忽略不写.

/AAA
等价于 /child::AAA

/child::AAA
等价于/AAA

/AAA/BBB
等价于/child::AAA/child::BBB

十二、descendant (后代)轴包含上下文节点的后代,一个后代是指子节点或者子节点的子节点等等, 因此descendant轴不会包含属性和命名空间节点。

/descendant::*
选择文档根元素的所有后代.即所有的元素被选择

/AAA/BBB/descendant::*
选择/AAA/BBB的所有后代元素

//CCC/descendant::*
选择在祖先元素中有CCC的所有元素

//CCC/descendant::DDD
选择所有以CCC为祖先元素的DDD元素

十三、parent轴(axis)包含上下文节点的父节点, 如果有父节点的话

//DDD/parent::*
选择DDD元素的所有父节点

十四、ancestor轴(axis)包含上下节点的祖先节点, 该祖先节点由其上下文节点的父节点以及父节点的父节点等等诸如此类的节点构成,所以ancestor轴总是包含有根节点,除非上下文节点就是根节点本身.

/AAA/BBB/DDD/CCC/EEE/ancestor::*
选择一个绝对路径上的所有节点

//FFF/ancestor::*
选择FFF元素的祖先节点

十五、following-sibling轴(axis)包含上下文节点之后的所有兄弟节点

/AAA/BBB/following-sibling::*
/AAA/BBB节点同层次的他之后兄弟节点

//CCC/following-sibling::*
所有CCC节点的它之后的兄弟节点

十六、preceding-sibling 轴(axis)包含上下文节点之前的所有兄弟节点

/AAA/BBB/following-sibling::*
/AAA/BBB节点同层次的他之前兄弟节点

//CCC/following-sibling::*
所有CCC节点的它之前的兄弟节点

十七、following轴(axis)包含同一文档中按文档顺序位于上下文节点之后的所有节点, 除了祖先节点,属性节点和命名空间节点

/AAA/XXX/following::*
/AAA/XXX之后的除了它的祖先节点以外的它之后所有节点

十八、following轴(axis)包含同一文档中按文档顺序位于上下文节点之前的所有节点, 除了祖先节点,属性节点和命名空间节点

/AAA/XXX/preceding::*
/AAA/XXX之后的除了它的祖先节点以外的它之前的所有节点

十九、descendant-or-self 轴(axis)包含上下文节点本身和该节点的后代节点

/AAA/XXX/descendant-or-self::*
包含/AAA/XXX自身的及它的子孙的节点

二十、ancestor-or-self 轴(axis)包含上下文节点本身和该节点的祖先节点

/AAA/XXX/DDD/EEE/ancestor-or-self::*
包含/AAA/XXX/DDD/EEE自身的及它的祖先的节点，不包含兄弟节点

二十一、ancestor, descendant, following, preceding 和self轴(axis)分割了XML文档(忽略属性节点和命名空间节点), 不能交迭, 而一起使用则包含所有节点

二十二、div运算符做浮点除法运算, mod运算符做求余运算, floor函数返回不大于参数的最大整数(趋近于正无穷), ceiling返回不小于参数的最小整数(趋近于负无穷)

//BBB[position() mod 2 = 0 ]
选择偶数位置的BBB元素

//BBB[ position() = floor(last() div 2 + 0.5) or position() = ceiling(last() div 2 + 0.5) ]
选择中间的BBB元素

//CCC[ position() = floor(last() div 2 + 0.5) or position() = ceiling(last() div 2 + 0.5) ]
选择中间的CCC元素

二

XPath 语法规则

XPath使用路径表达式去确定XML文档中的节点。

我们将利用下面的XML文档描述XPath语法

<?xml version="1.0" encoding="GB2312"?>

<order>
<item catalog="parts">
    <itemNumber>C2688-67037</itemNumber>
    <description>LCD液晶显示器</description>
    <quantity>1</quantity>
    <price>358.00</price>
</item>
    <item catalog="parts">
    <itemNumber>C2688-67061</itemNumber>
    <description>音箱</description>
    <quantity>1</quantity>
    <price>16.50</price>
</item>
    <item catalog="parts">
    <itemNumber>C2688-67010</itemNumber>
    <description>鼠标</description>
    <quantity>1</quantity>
    <price>8.50</price>
</item>
</order>

节点定位：

XML文挡可以表示为树结构节点形式
XPath使用模式表达式识别XML文档的节点。

一个XPath的模式是使用反斜杠“/”分开子元素名称描述路径

下面的XPath表达式选择元素order下元素item中的所有price元素
/order/item/price

注释：用“/”路径开始代表元素的绝对路径.

不用“/”路径开始代表元素的相对路径

item/price

用“//”路径开始代表整个文档满足条件的所有元素

下面的XPath表达式选择文档中所有的item元素
//item

选择未知元素

通配符 “*”可用于选择未知XML元素

下面的XPath表达式选择元素order中的所有item元素所属的子元素

/order/item/*

下面的XPath表达式选择元素order下所有孙子辈的price元素
/order/*/price

下面的XPath表达式选择所有具有两个祖先的price元素
/*/*/price

下面的XPath表达式选择文档所有元素
//*

选择分支

使用方括号[]可以指定特定的元素

下面的XPath表达式选择元素order中的第一个item的子元素

/order/item[1]

下面的XPath表达式选择元素order中的最后一个item的子元素
/order/item[last()]

下面的XPath表达式选择元素order中具有price元素的item元素
/order/item[price]

下面的XPath表达式,从元素order中选择具有price等于12.60元素的item元素
/order/item[price=16.50]

下面的XPath表达式,从隶属于元素order的item元素中选择具有price等于12.60元素的price元素
/order/item[price=16.50]/price

选择几个路径

在XPath表达式中，使用 "|" 运算符可以选择几个路径。实质上是逻辑“与”操作

下面的XPath表达式,从隶属于order的item元素中选择所有itemNumber 和description 元素
/order/item/itemNumber | /order/item/description

下面的XPath表达式,从文档中选择所有itemNumber 和description 元素
//itemNumber | //description

下面的XPath表达式,从文档中选择所有itemNumber ，description和price 元素
//itemNumber | //description | //price

下面的XPath表达式,选取属于order中item下所有itemNumber元素和从文档中选择所有description元素
/order/item/itemnumber | //description

选择属性
在XPath中，所有属性使用@前缀

下面的XPath表达式,选取所有名为catalog的属性
//@catalog

下面的XPath表达式,选取所有具有catalog属性的item元素
//item[@catalog]

下面的XPath表达式,选取所有具有任何属性的item元素
//item[@*]

下面的XPath表达式,选取所有具有catalog等于"parts"属性的item元素
//item[@catalog="parts"]

ALENTAM

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
xpath

一AAA> BBB/> CCC/> BBB/> BBB/> DDD> BBB/> DDD> CCC/> AAA> 一、基本的XPath语法类似于在一个文件系统中定位文件,如果路径以斜线 / 开始, 那么该路径就表
复制链接

扫一扫

专栏目录