Xpath

最新推荐文章于 2024-09-28 17:40:14 发布

Acacia et acacia

最新推荐文章于 2024-09-28 17:40:14 发布

阅读量377

点赞数 11

文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/QI077/article/details/135509582

版权

XPath 是一门在 XML 文档中查找信息的语言。

XPath 是 XSLT 中的主要元素。

XQuery 和 XPoint

XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。

xpath语法的一些规律

用xpath语法提取基于节点路径，每次只要输入一个字符串，字符串按照格式填写就能完成提取
格式是一层层的节点，用/分离，通过[]在后面加入该节点的属性判断来唯一确定节点位置
提取的结果永远是list，最后都要用索引提取
不特殊指定的情况下会自动寻找所有满足条件的结果，可以在提取结果中用索引筛选，也可以在xpath内部使用索引
语法中分隔节点有两种方法/和//，它们之间的差别在于，前者只寻找子节点，后者会寻找子孙所有后代的节点，将所有满足条件的全都找到
刚开始总是用//是因为我们不会从第一个节点一个一个写，写到我们想要的节点上去，这样代码就太长了。所以直接从中间找到一个便于唯一确定我们要找的位置的节点，再往后找就行了
xpath好像不能查看一个节点所有属性以及专门去判断有没有某属性等
提取内容
因为xpath提取到的整个标签展现形式是这样的[<Element h1 at 0x2122e994748>]，所以先讲如何提取内容，之后讲如何提取标签时，才好根据输出内容来区分提出来的是什么东西。

提取内容分为两个部分
提取标签内容，用/text()
提取标签属性值，用/@属性名

识别标签

1.只根据标签来识别

2.同时根据标签和属性识别

3.根据标签内内容来识别

4.根据位置识别

Acacia et acacia

关注

11
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Acacia et acacia CSDN认证博客专家 CSDN认证企业博客

码龄2年

14: 原创

58万+: 周排名

8万+: 总排名

7586: 访问

: 等级

258: 积分

101: 粉丝

140: 获赞

3: 评论

134: 收藏

私信

关注

热门文章

最新评论

MySQL商品品牌信息与redis同步，实现增量和全量同步
CSDN-Ada助手: 恭喜博主能够成功地实现了MySQL商品品牌信息与redis的同步，实现了增量和全量同步，这对于提升系统的性能和稳定性无疑是很重要的一步。希望博主能够继续保持创作的热情和积极性，不断分享自己的技术经验和心得体会。在下一步的创作中，建议可以分享一些关于数据库优化或者性能调优方面的经验，这对于提升系统的吞吐量和响应速度也是非常重要的。期待博主的更多精彩内容，加油！
爬虫循环添加到数据库出现主键重复的错误解决
CSDN-Ada助手: 恭喜你写下了这篇关于解决爬虫循环添加到数据库出现主键重复错误的博客！你的经验分享对于遇到类似问题的人们来说肯定会有所帮助。不过，我想建议你在下一篇博客中可以分享一些关于如何优化爬虫程序的内容，或者是介绍一些常见的爬虫陷阱以及如何避免它们。希望你能继续保持创作，期待你更多的精彩内容！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
简易计算器
CSDN-Ada助手: 恭喜你成功写出了第一篇博客！简易计算器是一个很好的起点，希望你能在以后的创作中继续发掘自己的潜力。建议你可以尝试挑战一些更复杂的计算器，或者加入一些实用的功能，让你的博客更加丰富多彩。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。