python中使用xpath_python中使用XPath

最新推荐文章于 2024-04-07 08:00:00 发布

weixin_39589394

最新推荐文章于 2024-04-07 08:00:00 发布

阅读量230

点赞数

文章标签： python中使用xpath

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39589394/article/details/111417293

版权

XPath在Python的爬虫学习中，起着举足轻重的地位，对比正则表达式 re两者可以完成同样的工作，实现的功能也差不多，但XPath明显比re具有优势，在网页分析上使re退居二线。

XPath介绍：

是什么？全称为XML Path Language 一种小型的查询语言

说道XPath是门语言，不得不说它所具备的优点：

1) 可在XML中查找信息

2) 支持HTML的查找

3) 通过元素和属性进行导航

python开发使用XPath条件：

由于XPath属于lxml库模块，所以首先要安装库lxml，具体的安装过程可以查看博客，包括easy_install 和 pip 的安装方法。

XPath的简单调用方法：

from lxml import etree

selector=etree.HTML(源码) #将源码转化为能被XPath匹配的格式

selector.xpath(表达式) #返回为一列表

XPath的使用方法：

首先讲一下XPath的基本语法知识：

四种标签的使用方法

1) // 双斜杠定位根节点，会对全文进行扫描，在文档中选取所有符合条件的内容，以列表的形式返回。

2) / 单斜杠寻找当前标签路径的下一层路径标签或者对当前路标签内容进行操作

3) /text() 获取当前路径下的文本内容

4) /@xxxx 提取当前路径下标签的属性值

5) | 可选符使用|可选取若干个路径如//p | //div 即在当前路径下选取所有符合条件的p标签和div标签。

最低0.47元/天解锁文章

weixin_39589394

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python中使用xpath_python中使用XPath

XPath在Python的爬虫学习中，起着举足轻重的地位，对比正则表达式 re两者可以完成同样的工作，实现的功能也差不多，但XPath明显比re具有优势，在网页分析上使re退居二线。XPath介绍：是什么？全称为XML Path Language一种小型的查询语言说道XPath是门语言，不得不说它所具备的优点：1) 可在XML中查找信息2) 支持HTML的查找3) 通过元素和属性进行导航pyt...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。