xpath 查找子节点

XPath 是一种在 XML 文档中查找信息的语言。在 XPath 中,有多种方法可以用来查找子节点。

这里我将列出一些基本的方法。

  1. 返回直接子节点
    直接使用 / 后跟子节点名称即可。例如:/parent/child 将返回名为 child 的直接子节点

  2. 返回所有子节点
    使用 // 运算符可以查找所有子节点,无论其深度如何。例如,/parent//child 将返回名为 child 的所有子节点,无论它们在层级结构中的位置

  3. 返回特定属性的子节点
    你可以使用方括号([])来查找具有特定属性的子节点。例如,/parent/child[@attribute='value'] 将返回所有名为 child 的子节点中,属性值等于 'value' 的节点

例如,有如下的 XML 结构:

<a>
  <b>
    <c></c>
  </b>
  <b>
    <d></d>
  </b>
</a>

你想找到 a 的所有 b 子节点,可以这样写:/a/b
你想找到 a 的所有 b 节点,无论它们在 a 下面多深的层级,可以这样写:/a//b
你想找到 a 的所有子节点中,轴元素是 b,并且包含一个 c 节点,可以这样写:/a/b[c]

  • 6
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
JsoupXpath 是一款纯Java开发的使用xpath解析html的解析器,xpath语法分析与执行完全独立,html的DOM树生成借助Jsoup,故命名为JsoupXpath.为了在java里也享受xpath的强大与方便但又苦于找不到一款足够强大的xpath解析器,故开发了JsoupXpath。JsoupXpath的实现逻辑清晰,扩展方便,支持几乎全部常用的xpath语法.http://www.cnblogs.com/ 为例 "//a/@href"; "//div[@id='paging_block']/div/a[text()='Next >']/@href"; "//div[@id='paging_block']/div/a[text()*='Next']/@href"; "//h1/text()"; "//h1/allText()"; "//h1//text()"; "//div/a"; "//div[@id='post_list']/div[position()1000]/div/h3/allText()"; //轴支持 "//div[@id='post_list']/div[self::div/div/div/span[@class='article_view']/a/num()>1000]/div/h3/allText()"; "//div[@id='post_list']/div[2]/div/p/preceding-sibling::h3/allText()"; "//div[@id='post_list']/div[2]/div/p/preceding-sibling::h3/allText()|//div[@id='post_list']/div[1]/div/h3/allText()"; 在这里暂不列出框架间的对比了,但我相信,你们用了会发现JsoupXpath就是目前市面上最强大的的Xpath解析器。 快速开始 如果不方便使用maven,可以直接使用lib下的依赖包跑起来试试,如方便可直接使用如下dependency(已经上传至中央maven库,最新版本0.1.1):    cn.wanghaomiao    JsoupXpath    0.1.1 依赖配置好后,就可以使用如下例子进行体验了!String xpath="//div[@id='post_list']/div[./div/div/span[@class='article_view']/a/num()>1000]/div/h3/allText()";String doc = "..."; JXDocument jxDocument = new JXDocument(doc); List<Object> rs = jxDocument.sel(xpath); for (Object o:rs){     if (o instanceof Element){             int index = ((Element) o).siblingIndex();             System.out.println(index);     }     System.out.println(o.toString()); } 其他可以参考 cn.wanghaomiao.example包下的例子 语法 支持标准xpath语法(支持谓语嵌套),支持全部常用函数,支持全部常用轴,去掉了一些标准里面华而不实的函数和轴,下面会具体介绍。语法可以参考http://www.w3school.com.cn/xpath/index.asp 关于使用Xpath的一些注意事项 非常不建议直接粘贴Firefox或chrome里生成的Xpa
zyXML 是一个轻便、小巧的,纯易语言代码来解析 XML的 模块。 优点: 1 、不依赖任何 DLL 、支持库、系统组件( Microsoft.XMLDOM 等对象) 2 、支持 UTF-8 、 UTF-16 等编码 3 、支持 XPath 语法来查询节点 4、支持 CDATA 5 、开源(如果有任何问题可以自己修改) 缺点: 1 、加载速度稍微逊色于支持库,但是查询速度很快。 2 、不支持 DTD ,也就是类似于如下的节点 ]> 3 、 XPath 查询语法支持不全(要全部支持太麻烦了,实在没精力去解析了) XPath 具体语法可参考: http://www.w3school.com.cn/xpath/xpath_syntax.asp 目前支持的 XPath 语法有限,不支持的有: 1 、查找只能返回节点,而不能返回属性,当然查找条件可以有属性,如:节点名 [@ 属性名\n='\n\u5c5e\u6027\u503c\n'] 2 、 [] 括号里面的谓语表达式 仅仅支持一个操作符号,且不支持 | 、 or 、 and 和 mod ,并且属性名不支持 * ,仅仅元素名才支持 * 3 、轴 不支持 following 、 namespace 、 preceding 和 preceding-sibling 4 、函数都不支持,但是可以有如下使用: node() 可返回所有节点且不管节点是什么类型 cdata() 仅查找 CDATA 类型的节点 text() 仅查找 文本 节点 comment() 仅查找 注释 节点 * 仅查找 元素 节点 举一些支持的例子 路径表达式 结果 bookstore 选取 bookstore 元素的所有子节点。 /bookstore 选取根元素 bookstore 。 注释:假如路径起始于正斜杠 (/ ) ,则此路径始终代表到某元素的绝对路径! bookstore/book 选取属于 bookstore 的子元素的所有 book 元素。 //book 选取所有 book 子元素,而不管它们在文档中的位置。 bookstore//book 选择属于 bookstore 元素的后代的所有 book 元素,而不管它们位于 bookstore 之下的什么位置 /bookstore/book[1] 选取属于 bookstore 子元素的第一个 book 元素。 /bookstore/book[last()] 选取属于 bookstore 子元素的最后一个 book 元素。 /bookstore/book[last()-1] 选取属于 bookstore 子元素的倒数第二个 book 元素。 //title[@lang] 选取所有拥有名为 lang 的属性的 title 元素。 //title[@lang='eng'] 选取所有 title 元素,且这些元素拥有值为 eng 的 lang 属性。 /bookstore/book[price>35.00] 选取 bookstore 元素的所有 book 元素,且其中的 price 元素的值须大于 35.00 。 /bookstore/book[price>35.00]/title 选取 bookstore 元素中的 book 元素的所有 title 元素,且其中的 price 元素的值须大于 35.00 。 child::book 选取所有属于当前节点的子元素的 book 节点。 child::* 选取当前节点的所有子元素。 child::text() 选取当前节点的所有文本子节点。 child::node() 选取当前节点的所有子节点。 descendant::book 选取当前节点的所有 book 后代。 ancestor::book 选择当前节点的所有 book 先辈。 ancestor-or-self::book 选取当前节点的所有 book 先辈以及当前节点(如果此节点是 book 节点) child::*/child::price 选取当前节点的所有 price 孙节点。 另外元素索引我好像弄成从 0 开始了,好像 XPath 本身索引是从 1 开始的。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

LXSHYZHX

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值