简介:
XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。
XPath 路径表达式:
XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。
下面列举一些最常用的路径表达式:
nodename:选取此节点的所有子节点
/:从根节点选取
//:从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置
.:选取当前节点
..:选取当前节点的父节点
@:选取属性
*:匹配任何元素节点
@*:匹配任何属性节点
node():匹配任何类型的节点
下面我们实例介绍一些用法:
我们打开谷歌浏览器的检查元素选项
我们右击鼠标选择copy,然后选择copy xpath选项把路径复制下来://*[@id="Main"]/div[2]/div[1]/h1
该xpath表达式为://*[@id="Main"]/div[2]/div[1]/h1
解释该表达式:选取所有带属性“id=Main”的标签,其位置在第一个div标签下的第二个div标签中的h1标签中
我们会对该网站的首页按照同样的方法选取一个标题的xpath路径:
//*[@id="Main"]/div[2]/div[4]/table/tbody/tr/td[3]/span[1]/a
这条xpath路径匹配第二个文章标题,我们修改一下去掉一些定位具体文章标题的信息,修改后如下:
//*[@id="Main"]/div/div/table/tbody//span[1]/a
我们发现这条xpath路径表达式可以匹配这一页五十篇文章的标题了,这就是xpath的简单用法,学习一下xpath的语法可以帮助我们理解xpath路径表达式的含义。