2020-12-15

yzwnbxx

于 2020-12-15 22:08:38 发布

阅读量60

点赞数

分类专栏：代码学习文章标签： xpath python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yzwnbxx/article/details/111240912

版权

代码学习专栏收录该内容

16 篇文章 0 订阅

订阅专栏

文章目录

xpath表达式
一、层级
- 1.层级定位
二、属性和索引定位
- 1.属性定位
- 2.索引定位
三、取文本和属性
- 1.取文本的两种类型
- 2.获取属性
总结

xpath表达式

今天详细学习了xpath表达式

一、层级

xpath表达式中层级表达有点类似bs4中的层级，在bs4中是使用 > 和空格进行层级分类，而在xpath中则是使用/和//。接下来，我们一起深入学习一下吧。

1.层级定位

1./：表示的是从根节点开始定位，同时表示一个层级。

tree = etree.parse('test.html')
r = tree.xpath('/html/body/div')

2.//:表示多个层级。可以表示从任意位置开始定位（将//放在层级表达式的最前面）

tree = etree.parse('test.html')
r = tree.xpath('/html//div')
r = tree.xpath('//div')

二、属性和索引定位

1.属性定位

属性定位：//div[@class='song'] 即：//标签名[@属性=‘属性名’]

tree = etree.parse('test.html')
r = tree.xpath('//div[@class='song']')

2.索引定位

索引定位：//div[@class='song']/p[3] 需注意：索引是从1开始的。

tree = etree.parse('test.html')
r = tree.xpath('//div[@class='tang']/li[5]')

三、取文本和属性

1.取文本的两种类型

1.获取标签中直系的文本类容：/text（）

tree = etree.parse('test.html')
r = tree.xpath('//div[@class='tang']/li[3]/a/text()')[0]

2.获取标签中的非直系类容： //text（）

tree = etree.parse('test.html')
r = tree.xpath('//div[@class='tang']//text()')

2.获取属性

取属性：/@属性名如：img/@src

tree = etree.parse('test.html')
r = tree.xpath('//div[@class='song']/img/@src')

总结

到这里xpath的基本表达式就学完了，接下来我们将进行案例学习。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2020-12-15

文章目录xpath表达式一、层级1.层级定位二、属性和索引定位1.属性定位2.索引定位三、取文本和属性1.取文本的两种类型2.获取属性总结xpath表达式今天详细学习了xpath表达式一、层级xpath表达式中层级表达有点类似bs4中的层级，在bs4中是使用 > 和空格进行层级分类，而在xpath中则是使用/和//。接下来，我们一起深入学习一下吧。1.层级定位1./：表示的是从根节点开始定位，同时表示一个层级。tree = etree.parse('test.html')r = t
复制链接

扫一扫

专栏目录

yzwnbxx CSDN认证博客专家 CSDN认证企业博客

码龄4年

21: 原创

16万+: 周排名

68万+: 总排名

2534: 访问

: 等级

216: 积分

1: 粉丝

1: 获赞

2: 评论

2: 收藏

私信

关注

热门文章

分类专栏

笔记 1篇
代码学习 16篇
深度学习 2篇
UI设计 2篇

最新评论

2020-12-19
不吃西红柿丶: 感谢大佬的整理，期待后续大作
2020-11-25
不正经的kimol君: 代码之路任重道远，愿跟博主努力习之。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。