python读取wordelement_用ElementT提取<strong>文本

我尝试运行以下代码从XML文件中提取所有文本:

请注意“单词_1_14”—其中文字.text被发现是非类型所以没有打印出来…我发现这是因为文本带有强标记,从而使其不可见。你知道如何找到带有强标记的单词并打印出来吗?在

这行有问题-似乎单词_1_14的单词是非类型对象…这使得无法打印出文本。在In the Python code:

for word in ocr_word:

In the XML file:

I

在我看来等着找无法处理用强标记突出显示的XML文本。在

Python代码:

^{pr2}$

这是xml:

/p>

"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">

STATION

LOCATION

ELEVATION

ABOVE

SEA

GROUND

LEVEL

L

A

T

I

T

U

I

I

Afifine

D

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值