在爬虫中,xpath用于提取信息,但是xpath语法上手难度较高。本文将力求让读者掌握一种较为简单的xpath使用方法。
插件下载
在chrome应用商店中下载插件“xpath helper”(需要科学上网)
下载完毕后,使用ctrl+shift+x打开插件(也用同样的方式关闭),将光标置于某一个元素之上,点击shift,即可看到元素对应的xpath路径。
一般来说,页面上同类元素有着结构相似的xpath路径,我们以CSDN视频热榜为例:
第一条的xpath:
/html/body/div[@id='app']/div/div[@class='main']/div[@class='page-container page-component