path = 'yourxmlfilepath.xml'
tagyouwant='Headline' #just an example, i wanted the text between 'Headline' tags
opentag=''
closetag=''+tagyouwant+'>'
with open(path,'rb') as inputfile:
for line in inputfile:
if opentag in line:
strtoget=str(line)
strtoget=strtoget.replace(opentag,"") #trimming the tags from the text
strtoget=strtoget.replace(closetag,"")
print strtoget
您可以使用现有的字符串来完成所需的操作,而不是使用最终的打印语句。或者,您也可以将其作为批处理或命令行运行,并输出到.txt,然后在执行该操作时存储所有值(这取决于您想如何处理它)。
不管怎样,我认为这是一个聪明的,内存高效的方法来解析巨大的XML文件,当你确切地知道你想从中得到什么时。