python的lxml模块,

第三方模块安装:pip instll lxml

获取文本内容用:text()

取后代的标签用://

通配符,代表任意标签:/*

from lxml import etree

xml = '''
<book>
    <id>1</id>
    <name>中秋节月饼</name>
    <price>9.8元</price>
    <nick>博饼</nick>
    <author>
        <nick id="1">嫦娥</nick>
        <nick id="2">月兔</nick>
        <nick id="3">广寒宫</nick>
        <dv>
            <nick id="4">天蓬元帅</nick>
        </dv>
        <span>
            <nick id="5">王刚</nick>
        </span>
    </author>

    <parent>
        <nick id="5">后裔</nick>
    </parent>
</book>
'''

tree = etree.XML(xml)  # 先创建一个etree对象
result1 = tree.xpath('/book/nick/text()')  # text():作用是拿文本
print (result1)  # 输出:['博饼']

result2 = tree.xpath('/book/author/nick/text()') # 取同一层级下的所有nick标签的文本
print(result2) # 输出:['嫦娥', '月兔', '广寒宫']

result3 = tree.xpath('/book/author//nick/text()')  # :"//“取author下所有的nick标签的文本
print(result3)

result4 = tree.xpath('/book/author/*/nick/text()')  #  "*"通配符,代表任意结点,因为有2个nick分别在div,span下面
print(result4)

result5 = tree.xpath('/book//nick/text()')  # 获取book下所有nick的文本
print(result5)




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值