XPath插件语法及使用
最近在学习爬虫相关的知识,对于网页标签选取,google浏览器的插件xpath很好用,在此分享给大家。
1. 在浏览器上面安装xpath插件
在浏览器的扩展程序中搜索xpath,选择第一个安装,安装成功如下图所示:
2. XPath使用
2.1 XPath路径表达式
|
路径表达式 | 描述 |
---|---|
/div | 从根节点开始选取div节点 |
//a | 选取文档中所有a节点而不考虑位置 |
@class | 选取名为class的属性 |
. | 选取当前节点 |
… | 选取当前节点的父节点 |
/div/a | 从根节点开始选取div节点下的a节点 |
/div/a[2]/img | 从根节点开始选取div节点下的第二个a节点下的img节点 |
//div[@class=‘header-wrapper’] | 选取所有属性class的值为header-wrapper的div节点 |
//* | 选取文档中的所有元素 | </