python xpath 使用
主要适用于xml数据,html是xml当然是可以使用的
主要是利用xml数据中间的标签,属性来定位元素
from lxml import etree
"""
练习xpath
"""
f = open("ovs.html",mode="r",encoding="utf-8")
data = f.read()
et = etree.HTML(data) #将数据加载到et对象中,是一个element对象
result = et.xpath("/html") # /html 为根节点,
result = et.xpath("/html/body") #从/html/body节点中去找
result = et.xpath("/html/body/table") #/html/body/table中间去找
result = et.xpath("/html/body/table/tr/td/text()") #从html/body/table/tr/td/ 中的文本信息 text() 表示文本信息
result = et.xpath("/html/body/*/tr/td/text()") #* 为通配符,代表任意
result = et.xpath("//td/a/text()") #//匹配选择的文本,不考虑位置,就是任意位置
result = et.xpath("//td/a[2]/text()") #[] 前面标签中的位置,从1开始
result = et.xpath("//td/a[2]/@href") # @xxx 表示属性值
print(result)