X-Path介绍
X-Path 与正则表达式都是对网页数据的提取,正则表达式功能强大,但相对复杂,X-Path语法相对简单,可以通过谷歌插件安装x-path
1.X-Path谷歌插件下载地址
链接:https://pan.baidu.com/s/1sAYwo12CRN3x06d1HuKrfw
提取码:pgxk
2.X-Path语法
表达式 | 描述 |
---|---|
/ | 根节点选取或下级 |
// | 任意节点,不考虑位置 |
. | 当前节点 |
… | 当前节点的父节点 |
@ | 选取属性 |
* | 匹配任何节点 |
[] | 根据节点筛选 |
contains(@属性,“包含的内容” | 模糊查询 |
text() | 文本内容 |
3.案例
取得class为classify的h3标签下a标签内的内容
//h3[@class="classify"]/a/text()
利用模糊查询查找class类名中包含classify_list的所有div标签下的span下的a标签的文本内容
//div[contains(@class,"classify_