【编译原理】FIRST集合和FOLLOW集合

最新推荐文章于 2023-02-12 12:06:59 发布

Vav_a

最新推荐文章于 2023-02-12 12:06:59 发布

阅读量1w

点赞数 86

CC 4.0 BY-SA版权

分类专栏：编译原理

本文链接：https://blog.csdn.net/MillionSong/article/details/106596839

编译原理专栏收录该内容

2 篇文章

订阅专栏

本文深入解析编译原理中的FIRST集合和FOLLOW集合概念，详细阐述其计算规则，并通过实例演示如何进行具体应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

FIRST集合

定义：可从α推导得到的串的首符号的集合，其中α是任意的文法符号串。

规则：计算文法符号 X 的 FIRST(X)，不断运用以下规则直到没有新终结符号或 ε可以被加入为止：

（1）如果 X 是一个终结符号，那么 FIRST(X) = X。

（2）如果 X 是一个非终结符号，且 X ->Y1 Y2 … Yk是一个产生式，其中 k≥1，那么如果对于某个i，a在 FIRST(Y1）、FIRST(Y2）… FIRST(Yi-1）中，就把a加入到 FIRST(X) 中。

（3）如果 X ->ε是一个产生式，那么将ε加入到 FIRST(X)中。

上述为官方给出的计算FIRST集合的规则，不太好理解，接下来我将综合其他笔者总结的规则给出我理解的FIRST集合的规则。

（1）如果X是终结符，则FIRST(X) = { X } 。
（2）如果X是非终结符，且有产生式形如X → a…，则FIRST( X ) = { a }。
（3）如果X是非终结符，且有产生式形如X → ABCdEF…（A、B、C均属于非终结符且包含 ε，d为终结符），需要把FIRST( A )、FIRST( B )、FIRST( C )、FIRST( d )加入到 FIRST( X ) 中。
（4）如果X经过一步或多步推导出空字符ε，将ε加入FIRST( X )。

下面给出文法示例并做讲解:

E -> T E'
E' -> + T E' | ε
T -> F T'
T' -> * F T' | ε
F -> ( E ) | id

FIRST(E) = FIRST(T) 根据规则3，很容易理解，这里要注意的由于T不含ε，所以遍历到T就停止了，E’不会加入进来
FIRST(E’) = FIRST(+) ∪ FIRST(ε)= { +, ε } 根据规则2和4，,很好理解
FIRST(T) = FIRST(F) 根据规则3，和第一条推导过程一样
FIRST(T’) = FIRST() ∪ FIRST(ε)= { , ε } 根据规则2和4，和第二条推导一样
FIRST(F) = FIRST( ( ) ∪ FIRST(id)= { ( , id } 根据规则2

结果：

FIRST(E) = FIRST(T) = FIRST(F) = { ( , id }

FIRST(E') = FIRST(+) ∪ FIRST(ε)= { + , ε }

FIRST(T') = FIRST(*) ∪ FIRST(ε)= { * , ε }

FOLLOW集合

定义：对于非终结符号X，FOLLOW（X）被定义为可能在某些句型中紧跟在A右边的终结符号集合。

规则：计算文法符号 X 的 FOLLOW(X) ，不断运用以下规则直到没有新终结符号可以被加入任意FOLLOW集合为止：

（1）将#加入到FOLLOW(X)中，其中S是开始符号，而#是输出右端的结束标记。

（2）如果存在一个产生式S->αXβ，那么将集合FIRST(β)中除ε外的所有元素加入到FOLLOW(X)当中。

（3）如果存在一个产生式 S->αX , 或者S->αXβ且FIRST(β)中包含ε , 那么将集合FOLLOW(S)中的所有元素加入到集合FOLLOW(X)中。

理解：FOLLOW集合对于非终结符而言，是非终结符的全部后跟符号的集合，

如果后跟终结符则加入，

如果后跟非终结符，则加入该非终结符的不含空符号串的FIRST集，

特别地，文法的识别符的FOLLOW集需要额外的加入‘#’。

下面给出简化后的规则：

首先：如果要找L的Follow，要从式子的右边找到L，然后来找L的Follow。

其次：将‘#’加入到 开始符 的 Follow中 ①

接着：如果L的右边是终结符，那么这个终结符加入L的Follow ②

如果L的右边是非终结符，那么把这个非终结符的First集合除去 ε后剩下的元素加到L的Follow中，同时将 '->' 符号左边的Follow加入L的Follow ③

特别的，如果L处在末尾，那么，将 '->' 符号左边的Follow加入L的Follow ④

练习：还是用之前的例子来做

1 | E -> T E'
2 | E' -> + T E' | ε
3 | T -> F T'
4 | T' -> * F T' | ε
5 | F -> ( E ) | id

FOLLOW(E) ，运用 ① ，E是开始符，所以首先将 # 加入到 FOLLOW(E)中；接下来在上述文法的右边找到 E ，发现E在第5行文法的右边，E 后面是终结符 ) ，所以将）加入到 FOLLOW(E)中；此处运用的是规则②，综上即 FOLLOW(E) = { ) , # }

FOLLOW(E’) ，先在上述文法的右边找到 E' ，发现E' 分别在第1行（在自己行不算），此时可以运用规则④，即将FOLLOW(E) 加入到FOLLOW(E')中，综上即 FOLLOW(E')= FOLLOW(E) = { ) , # }

FOLLOW(T)，先在上述文法的右边找到 T ，发现T在第一行，此时运用规则 ③，将E'的FIRST集合中除 ε外其他元素加入到FOLLOW(T)中，同时将FOLLOW(E) 加入到FOLLOW(T)中，综上即FOLLOW(T)= { + , ) , # }

FOLLOW(T’) ，先在上述文法的右边找到 T ' ，发现T'在第三行，此时可以运用规则④，即将FOLLOW(T) 加入到FOLLOW(T')中，综上即 FOLLOW(T')= FOLLOW(T) = { + , ) , # }

FOLLOW(F),先在上述文法的右边找到 F ，发现F在第三行和第四行，此时运用规则 ③，对于第3行，将T'的FIRST集合中除 ε外其他元素加入到FOLLOW(F)中，同时将FOLLOW(T) 加入到FOLLOW(F)中，此时FOLLOW(F)= { * , + , ) , # } ；对于第4行,将将T'的FIRST集合中除 ε外其他元素加入到FOLLOW(F)中，同时将FOLLOW(T') 加入到FOLLOW(F)中，而 FOLLOW(T')= FOLLOW(T)，所以FOLLOW(F)依旧= { * , + , ) , # } ，综上所述，FOLLOW(F)= { * , + , ) , # } 。

结果：

FOLLOW(E) = FOLLOW(E') = { ) , # }

FOLLOW(T) = FOLLOW(T') = { + , ) , # }

FOLLOW(F) = { * , + , ) ,# }