XPath 是解析XML的语言(html是xml的子集)。
节点
达式 | 描述 |
---|---|
nodename | 选取此节点的所有子节点。div: 选取div下的所有标签 |
/ | 取子节点. //head/title 选取head标签下的tital标签 |
// | //div 选取整个html中所有div的标签 |
@ | 选取某个属性的节点。结合一个[] 例://head/title[@class="mnav"][1] 第一个属性 |
. | 选取当前节点。例 ./span 当前节点下的span标签 |
.. | 选取当前节点的父节点。 |
谓语
路径表达式 | 结果 |
---|---|
//../..[1] | 选取子标签下的第1个标签 |
//../..[last()] | 选取子标签下的最后一个标签 |
//../book[last()-1] | 选取子标签下的倒数第二个 book 元素。 |
/bookstore/book[position()<3] | 选取最前面的两个属于 bookstore 元素的子元素的 book 元素。 |
//title[@lang] | 选取带有 lang 属性的 title 标签。 |
//title[@lang='eng'] | 选取所有 title 元素,且这些元素拥有值为 eng 的 lang 属性。 |
通配符
通配符 | 描述 |
---|---|
* | 匹配任何元素节点。//div[@id=’a_sup']/* div中所有id=’a_sup'的内容 |
@* | 匹配任何属性节点。//title[@*] 若标签下没有标签属性,则返回为空 |
Mac上安装谷歌XPath Helper插件
已经将插件准备好了,自行提取:
链接:https://pan.baidu.com/s/1uNYE5cFyrSuWCFQRwUCIYQ
提取码:p1jw
1、下载插件
2、将插件进行解压,我在访达里面直接双击就解压了
3、打开谷歌浏览器,选择右上方三个小点,找到更多工具,找到扩展程序点击进去
4、打开右上角的开发者模式
5、将解压好的插件包拖进来就OK,注意:跟Windows不同的是这个就是一个文件夹,名为xpath,将这一整个文件夹拖进去
6、将xpath插件选择启用就完成了,如果浏览器上还是没有出现xpath插件,将插件重新加载就OK
xpath在mac上的打开与关闭的快捷键为
command + shift + x