XPath定位

XPath是XML文档的路径语言, 使用路径表达式来选取 XML 文档中的节点或者节点集。XPath基于XML的树状结构,有不同类型的节点。

第一部分:路径表达式,是从一个XML节点(当前的上下文节点)到另一个节点、或一组节点的书面步骤顺序。这些步骤以“/”字符分开,每一步有三个构成成分:

轴描述(用最直接的方式接近目标节点)

节点测试(用于筛选节点位置和名称)

节点描述(用于筛选节点的属性和子节点特征)

实例:/html/body/div[4]/div[2]/div/div[2]/div[29]/h2

-----------------------扩展知识------------------------------------------------------------

如何从网页中获取元素的XPath?

打开网页->F12->网页中指向元素->右键->copy->copy Xpath

-----------------------扩展知识------------------------------------------------------------

第二部分:节点关系,节点(Node)是XPath 的术语, XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释、文档(根)节点,树的根被称为文档节点或者根节点。

例子:

<bookstore>

<book>

<title>题目</title>

<author>zz</author>

<year>2017</year>

<price>128.1</price>

</book>

</bookstore>

2.1、父(Parent)

每个元素以及属性都有一个父。如上例子中book 元素是 title、author、year 以及 price 元素的父

2.2、子(Children)

元素节点可有零个、一个或多个子,如上例子中title、author、year 以及 price 元素都是 book 元素的子

2.3、同胞(Sibling)

拥有相同的父的节点,如上例子中title、author、year 以及 price 元素都是同胞

2.4、先辈(Ancestor)

某节点的父、父的父,等等,如上例子中title 元素的先辈是 book 元素和 bookstore 元素

2.5后代(Descendant)

某个节点的子,子的子,等等,如上例子中bookstore 的后代是 book、title、author、year 以及 price 元素

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值