Xpath Helper (免费 Chrome 插件)
目录:
国内下载地址:https://chrome.zzzmh.cn/info/hgimnogjllphhhkhlmebbmlgjoejdpjl
这里以 www.baidu.com 为例
拓展:
b. 获取链接
一. 简介:
XPath Helper是一款专用于chrome内核浏览器的实用型爬虫网页解析工具(免费)。
当然还可对查询出的xpath进行编辑,正确编辑的结果将会显示在旁边的结果框,并在网页中高亮显示
更便于获取网页数据xpath,从而进行网络数据批量爬取
二. 下载:
2.进入并点击 ‘推荐下载’ 即可下载出压缩包,打开文件下载位置为一个zip文件
3.将压缩包解压, 有两个文件
三. 将插件添加至谷歌浏览器:
1.使用谷歌浏览器,打开设置(Settings)
2.点击扩展(Extensions)
3.打开 开发者模式(Developer mode)
4.将名为 ’hgimnogjllphhhkhlmebbmlgjoejdpjl_2.0.2_chrome.zzzmh.cn.crx‘ 的文件拖拽复制到chrome浏览器
5.点击弹窗中 ‘Add extension’ (添加扩展) 按钮
到此已将 Xpath Helper 插件已添加至谷歌浏览器
四. 简单举例使用方法
1.将 Xpath Helper 钉( pin ) 在主页上, 便于后期插件的使用
这里以 www.baidu.com 页面热搜为例
3.右键热搜链接,点击检查(inspect)
4.在弹出的 开发者工具栏 复制 Xpath (Copy Xpath) , 并点击上方 xpath helper 插件
5.点击插件后, 将刚复制的 xpath 粘贴至查询框
xpath正确,则结果框中显示网页中相应元素,且网页中相应数据高亮显示
//*[@id="hotsearch-content-wrapper"]/li[1]/a/span[2]
拓展:(当然也可对xpath 进行简单修改, 从而获取更精确或更为批量的数据)
自行对比与上方查询框中xpath的区别
a.批量获取数据
//*[@id="hotsearch-content-wrapper"]/li/a/span[2]
b. 获取链接
//*[@id="hotsearch-content-wrapper"]/li/a/@href
c. 获取文本
//*[@id="hotsearch-content-wrapper"]/li/a/span[2]/text()