我试图从
http://kanjivg.tagaini.net/解析.svg文件,但我无法成功提取内部信息.
0f9ab.svg的一部分如下所示:
我的.py文件:
import lxml.etree as ET
svg = ET.parse('0f9ab.svg')
print(svg) #
# AttributeError: 'lxml.etree._ElementTree' object has no attribute 'tag'
print(svg.tag)
# TypeError: 'lxml.etree._ElementTree' object is not subscriptable
print(svg[0])
# TypeError: 'lxml.etree._ElementTree' object is not iterable
for child in svg:
print(child)
# None
print(svg.find("./svg"))
# []
print(svg.findall("//g"))
# []
print(svg.xpath("//g"))
目的
我尝试了各种我能想到的操作,但没有任何东西从.svg文件中获取任何数据.
我想用kvg:element =“kanji”(它们处于不同的深度级别)提取汉字(日文字符).
题
>为此使用lxml错误的包吗?
>如果没有,我如何从解析的.svg文件中提取信息?
其他方案
>我当然可以将文件作为字符串和搜索来读取
对于kvg:element =“,但我想以正确的方式提取xml
/ svg.
>之前我使用过xmltodict,但我的代码变得非常混乱,提取kvg:element,因为它们处于不同的深度级别.