Xpath解析

XPath是一种在XML中查找信息的语言,适用于HTML子集。它利用文档的父子关系进行节点查找。文章介绍了XPath的基本原理,并提供了使用Python的lxml模块进行XPath解析的示例,包括属性筛选和获取元素属性值的方法。
摘要由CSDN通过智能技术生成

一、原理

XPath是在xml中搜索内容的一门语言,html是xml语言的一种子集。

xml的例子:

<book>
    <id>1</id>
    <name>追风筝的人</name>
    <author>
        <nick>卡勒德·胡赛尼</nick>
        <nike>Khaled Hosseini</nick>
    </author>
</book>

结点间存在父子关系,book是id,name,author的父节点,author是nick的父节点。

XPath解析按照文档的父子关系进行解析,可以通过节点间关系进行查找,也可以通过结点名称进行查找。

二、XPath的使用

安装模块:lxml

命令:pip install lxml -i +镜像地址

代码:

from lxml import etree
xml = """<book>
    <id>1</id>
    <name>追风筝的人</name>
    <author>
        <nick>卡勒德·胡赛尼</nick>
        <nick>Khaled Hosseini</nick>
        <div>
            <nick>test text</nick>
        </div>
    </author>
</book>
"""
tree = et
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值