spider获取数据重要方法_XPATH总结

最新推荐文章于 2024-01-23 20:02:11 发布

sola_酱

最新推荐文章于 2024-01-23 20:02:11 发布

阅读量412

点赞数

分类专栏： spider

本文链接：https://blog.csdn.net/qq_42223962/article/details/106617545

版权

本文介绍了使用XPath进行网页数据抓取的方法，重点讲解了如何利用Chrome插件XPath Helper辅助编写准确的XPath表达式，以及XPath在数据与Element相同场景下的应用。文章还分享了Chrome 50版本的下载链接，以解决离线安装插件的问题。

摘要由CSDN通过智能技术生成

1. 使用的XPath

我们使用的是Chrome的插件 Xpath Helper来提供我们写xpath的准确行,
要注意的是Chrome好像50及以下版本,才允许离线安装插件,因为不知道这点,当时真的坑了我一天的时间.
随便分享一下 Chrome50版本下载地址提取码: 5qan
我使用的是ubuntu系统喔!

当获得到的数据与Element数据相同时

表达式	描述
/	从根节点选取
//	从匹配选择的当前节点选择文档中的节点, 而不考虑他们的位置
.	当前节点位置
…	当前节点的父节点
@	获取属性如:@href @src
*[1]	获取第一个元素, 表示你要的标签, 也表示任意内容
text()	当前标签的内容