编译原理是程序语言的基础。也是人机交互的重要基石。
一般说来很少需要自己写晦涩的编译器,java世界就有几个不错的Parse Generator。
首先要澄清的概念就是编译器有基于LL(自顶向下)和LR(自底向上)两种算法,据我的了解,总的说来,LR比LL的效率更高,且没有左递归和二义性问题,就是生成出来的程序简直是天书,没法懂。不过LL生成的代码也好不到哪去,五十步笑百步。所以我更倾向与LR解析器。
Lex和Yacc,一个是词法分析器,一个是语法分析器(搞不懂为什么不干脆做到一起算了?),来自C++,现在好像有了JAVA版本。都是基于LR的。
JavaCC和Antlr都是基于LL的,但ANTLR的语法文件更简洁易懂,生成AST树时的控制也很多。