python xpath 使用

最新推荐文章于 2024-03-19 23:24:26 发布

marc_chen

最新推荐文章于 2024-03-19 23:24:26 发布

阅读量338

点赞数

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/marc_chen/article/details/125587082

版权

python 专栏收录该内容

27 篇文章

订阅专栏

python xpath 使用
主要适用于xml数据，html是xml当然是可以使用的
主要是利用xml数据中间的标签，属性来定位元素

from lxml import etree
"""
练习xpath
"""
f = open("ovs.html",mode="r",encoding="utf-8")
data = f.read()
et = etree.HTML(data)     #将数据加载到et对象中,是一个element对象
result = et.xpath("/html")   # /html 为根节点，
result = et.xpath("/html/body")    #从/html/body节点中去找
result = et.xpath("/html/body/table")   #/html/body/table中间去找
result = et.xpath("/html/body/table/tr/td/text()")   #从html/body/table/tr/td/ 中的文本信息   text() 表示文本信息
result = et.xpath("/html/body/*/tr/td/text()")            #* 为通配符，代表任意
result = et.xpath("//td/a/text()")                 #//匹配选择的文本，不考虑位置，就是任意位置
result = et.xpath("//td/a[2]/text()")              #[]  前面标签中的位置，从1开始
result = et.xpath("//td/a[2]/@href")               # @xxx 表示属性值
print(result)