记录XPath基本语法,使用一些简单的XPath语法提取文本
基本语法
- 获取文本
/text()
a/text()
获取a标签下的文本a//text()
获取a标签下的所有标签的文本//a[text()]='下一页>'
获取包含“下一页”文本的a标签
/@
- 获取属性
/@属性名
- 筛选属性
//标签[@属性名]
- 获取属性
//
- 在xpath开始的时候表示从当前html中任意位置开始选择
a//b
表示a标签下的任意b标签
|
- 或语法,多个条件一起
开始
- F12开发者模式抓包段子,发现
<dl>
标签为所选段子文本内容; - 在XPath Heaper中输入
//dl
发现右上角红框都选取了;