上次简单地介绍了一些词法分析
.class public Lcom/F8LEFT;
可以被分割为三个Token “.class” “public” “Lcom/F8LEFT;”
像这一类Token都可以按照其作用分为多种Token
比如,public private static等可以划分为flag的Token
分析器可以接收这一类Token,并且按照预定的规则进行分析。
那么,对于程序来说应该怎么去把这种字符串分析为相应的Token呢?
有一种比较简单的方法,就是利用正则表达式
比如,flag的正则为
public | private | static
通过定义多个正则可以准确地划分字符串为合适的Token。
然而,考虑到效率,是不建议对每一个Token进行比较,扫描的。因此,有必要寻求一种更高效的方法对字符串进行扫描。
举例来说,假如要区分IF ID,用c++可以这样实现
if(strcmp(src, "IF") == 0)
return TOK_IF;
e