xpath软件包:链接:https://pan.baidu.com/s/1ighxbTNAWqobGpsX0qkD8w
提取码:lkjh(若链接失效在下面评论,我会及时更新)
安装
1、打开chrome浏览器点击右上角的三个点
2、点击更多工具中的拓展程序
3、直接将xpth.zip拖拽进页面中
使用
在这里以我这篇博客为例子数据采集与存储案例
1、首先使用ctrl+shift+x快捷键打开xpath
2、右键点击想要爬取的数据,点击检查
3、观察网页结构
发现想要爬取的vivo x90在a标签中而a标签在div class=rank_name下面
所以我们可以先在查询框中这样编写
//div[@class="rank__name"]/a/text()
//可以跳跃多级结构
/只可以一级
发现想要的结果出现了
总结:在数据采集与存储案例中,由于还想要采集价格和评分,且由于价格和评分不处在同一class = rank_name下,而是都在同一class = rank-list__item clearfix下面,所以在案例中我向上取了一级再使用遍历拼接的方式以获得想要的数据