xpath格式转换

最新推荐文章于 2024-07-25 17:08:24 发布

Mis相遇

最新推荐文章于 2024-07-25 17:08:24 发布

阅读量4.5k

点赞数

本文链接：https://blog.csdn.net/python20180218/article/details/90581731

版权

from lxml import etree

#定义一个字符串 HTML
text = “”"

first item
second item
third item
fourth item
fifth item

"""

 print(text)
#初始化一个xpath一个解析对象,返回的是lxml文件对象
#这个文件对象可以使用xpath,其他都不可以。
html_xml=etree.HTML(text)
print(html_xml)
print(type(html_xml))

#返回一个bytes类型的HTML文件。
html_bytes=etree.tostring(html_xml,encoding="utf-8")
print(html_bytes)
print(type(html_bytes))

#将bytes类型转换成字符串，字符串可以用正则表达式
#转换的过程当中会将残缺的标签自动补齐
html_str=html_bytes.decode("utf-8")
print(html_str)
print(type(html_str))