只是为了给您提供一个上下文:我正在尝试将python源代码转换为一个XML文件(保留了注释),以便进一步处理
一个“简单”的方法是使用一个已经做到这一点的工具,而不是重新设计它,特别是如果你时间紧迫的话。在
我们的DMS软件重组工具包可以解析Python(和许多其他语言)、构建ast、捕获注释,并将生成的树转换为XML。参见下面的示例。在
注:XML最初看起来不错,但在表示/分析/转换代码时是一种笨拙的方法。像DMS这样的工具之所以存在,是为了提供所有必要的机制,以便以比XML转换更有效的方式操作解析的ast,并且扩展得更好(例如,可以扩展到数百万行代码):最终,可以节省工程时间和运行时间。在
即使您决定使用XML,您将从哪里获得处理它的好工具?(XSLT不是正确的答案)。最后,如果您打算修改程序,并且更改了XML,您打算如何取回源代码?DMS可以修改AST并重新生成有效的源程序文本(包括注释)。在
因此,虽然DMS将以XML格式导出AST(因为像您这样的人似乎坚持这样做),但实际上很少使用此特性。典型的用例是解析、分析、修改AST,然后预打印修改后的AST,所有这些都以集成的方式使用DMS。在
对于这个python程序:# A comment in the header
import sys
TOKENBLANKS=1
class MyClassNameTranslator:
# get_name looks up name
def get_name(self, name):
"""Get a translation for a real name"""
return self.realnames[name]
DMS生成其AST的以下XML版本,包括捕获的注释:
^{pr2}$