lxml.etree的使用

文档

中文文档
其他博主的翻译,只有部分
英文文档
自己使用英文文档的方法,ctrl+f,页面搜索想要查看的方法

常用的一个对象三个方法

Element对象

以下所有方法的使用都要将我们的字符串利用.HTML()方法转化为Element对象。 **Element对象是一个列表** 

etree.fromstring()(将字符串转化为Element对象)

from lxml import etree
text ='''
<root>
  <child1>nihao</child1>
  <child2>zhongg</child2>
</root>
'''
html = etree.fromstring(text)
print(html)
<Element root at 0x1c2698573c8>

etree.XML(str)(将XML转化为Element对象)

将字符串转化为Element对象,或者说解析XML页面,也可用于HTML,表现与fromstring类似
from lxml import etree
text ='''
<root>
  <child1>nihao</child1>
  <child2>zhongg</child2>
</root>
'''
xml = etree.XML(text)
print(xml)
[<Element child1 at 0x1815e2e64c8>]

etree.tostring()(将Element转化为string)

将Element转化为string
from lxml import etree
text ='''
<root>
  <child1>nihao</child1>
  <child2>zhongg</child2>
</root>
'''
html = etree.HTML(text)
print(etree.tostring(html))

不符合html格式的,转化为Element时etree会自动将他补全

b'<html><body><root>\n  <child1>nihao</child1>\n  <child2>zhongg</child2>\n</root>\n</body></html>'

etree.Parser(文件形式解析html内容)

文档传送门

Element.xpath(xpth定位标签)

用xpath定位到我们所需要的节点
from lxml import etree
text ='''
<root>
  <child1>nihao</child1>
  <child2>zhongg</child2>
</root>
'''
html = etree.HTML(text)
print(html.xpath("//child1/text()"))
#自己补充xpath内容

注意:Element对象是列表

['nihao']

以上是阅读文档时做的一些笔记,欢迎纠错。

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值