python xpath 使用

python xpath 使用
主要适用于xml数据,html是xml当然是可以使用的
主要是利用xml数据中间的标签,属性来定位元素

from lxml import etree
"""
练习xpath
"""
f = open("ovs.html",mode="r",encoding="utf-8")
data = f.read()
et = etree.HTML(data)     #将数据加载到et对象中,是一个element对象
result = et.xpath("/html")   # /html 为根节点,
result = et.xpath("/html/body")    #从/html/body节点中去找
result = et.xpath("/html/body/table")   #/html/body/table中间去找
result = et.xpath("/html/body/table/tr/td/text()")   #从html/body/table/tr/td/ 中的文本信息   text() 表示文本信息
result = et.xpath("/html/body/*/tr/td/text()")            #* 为通配符,代表任意
result = et.xpath("//td/a/text()")                 #//匹配选择的文本,不考虑位置,就是任意位置
result = et.xpath("//td/a[2]/text()")              #[]  前面标签中的位置,从1开始
result = et.xpath("//td/a[2]/@href")               # @xxx 表示属性值
print(result)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值