[python3 - package] lxml

最新推荐文章于 2023-03-01 23:04:06 发布

weixin_30412577

最新推荐文章于 2023-03-01 23:04:06 发布

阅读量72

点赞数

文章标签： python

原文链接：http://www.cnblogs.com/break-dawnn/p/9039006.html

版权

1. 安装 pip install lxml

2. 官方文档 http://lxml.de/

3. 常用类 - Element

将request.get()返回的html转换为Element

from lxml import etree

res = requests.get('http://www.test.com/1.html')
page = res.text
etree_source = etree.HTML(page) #返回Element类，直接打印为<Element html at 0x255a3437648>

4. 常用方法

Element.xpath()
- 返回Element类
- 可以精确定位到想要的node
- 如果匹配多个，可以循环
- 如果要获取这个element下，不管多少层的child node内的text,可以用Element.xpaht(string(.))
- 可以直接获取attribute，如Element.xpath('//a/@href')
Element.findall()
- 返回Elemenet类
- 能匹配到所有满足的路径
- 如果匹配多个，可以循环
- 不能直接获取attribute，如Element.xpath('//a/@href')

转载于:https://www.cnblogs.com/break-dawnn/p/9039006.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30412577

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[python3 - package] lxml

1. 安装 pip install lxml2. 官方文档http://lxml.de/3. 常用类 - Element将request.get()返回的html转换为Elementfrom lxml import etreeres = requests.get('http://www.test.com/1.html')page = res.texte...
复制链接

扫一扫