python etree详解_python – 解析lxml.etree._Element内容

我有一个我从< table>解析出来的元素.

target="_blank">

5548U


Power La Vaca
(M8025K)
Linux 4.2.x.x

我试图从这个元素(包括空格)中提取“55488 Power La Vaca(8025K)Linux 4.2.x.x”.

import lxml.etree as ET

td_html = """

target="_blank">

5548U


Power La Vaca
(M8025K)
Linux 4.2.x.x

"""

td_elem = ET.fromstring(td_html)

fail_1 = td_elem.find('a').text + td_elem.text

print "FAIL_1", fail_1

print "FAIL_2"

for elem in td_elem.iterchildren():

print elem.tag, elem.text

结果

$python textxml.py

FAIL_1

5548U

FAIL_2

a

5548U

br None

br None

br None

br None

$

令人羞愧的是,我不得不问这个问题,因为它似乎不应该很难.

如何从td_elem元素(包括空格)中提取“Power La Vaca(8025K)Linux 4.2.x.x”?

请,没有正则表达式解决方案.

显式解决方案(使用Finn的itertext()建议):

import lxml.etree as ET

td_html = """

target="_blank">

5548U


Power La Vaca
(M8025K)
Linux 4.2.x.x

"""

td_elem = ET.fromstring(td_html)

print "SUCCESS", ' '.join([txt.strip() for txt in td_elem.itertext()])

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值