LR(0)分析
通过一个书本的例子来说明:
文法G[S]为:
(1) S->aAcBe
(2) A->b
(3) A->Ab
(4) B->b
文法的LR(0)分析表如下:
此表时需要构造的,但是此处不详细叙述!直接使用了。
问题:现在根据文法G[S]判断字符串 abbcde# 是不是合法的?
对输入串 abbcde# 的分析过程
步骤 | 状态栈 | 符号栈 | 输入串 | ACTION | GOTO |
---|---|---|---|---|---|
(1) | 0 | # | abbcde# | S2 | |
(2) | 02 | #a | bbcde# | S4 | |
(3) | 024 | #ab | bcde# | r2 | 3 |
(4) | 023 | #aA | bcde# | S6 | |
(5) | 0236 | #aAb | cde# | r3 | |
(6) | 023 | #aA | cde# | S5 | 3 |
(7) | 0235 | #aAc | de# | S8 | |
(8) | 02358 | #aAcd | e# | r4 | 7 |
(9) | 02357 | #aAcB | e# | S9 | |
(10) | 023579 | #aAcBe | # | r1 | 1 |
(11) | 01 | #S | # | acc |
现在从步骤(1)开始解释:
步骤 | 状态栈 | 符号栈 | 输入串 | ACTION | GOTO |
---|---|---|---|---|---|
(1) | 0 | # | abbcde# | S2 |
步骤(1)
1:选取一个特殊的状态开始分析,在初态,终态和普通态中选一个,因为初态是唯一的,而终态和普通态都不一定是唯一的,所以选取初态作为分析的入口。
2:LR(0)分析表的第一列就是状态,所以0状态时符号栈为 # ,输入串为要分析的串,对应的 ACTION 为 S2,GOTO 为空。
步骤 | 状态栈 | 符号栈 | 输入串 | ACTION | GOTO |
---|---|---|---|---|---|
(2) | 02 | #a | bbcde# | S4 |
步骤(2)
1:符号栈和输入串是一个同步的过程,输入串从左向右 归约 的过程是一个 出栈 的过程。而对与符号栈就是一个 入栈 的过程。当输入串弹出一个元素,符号栈就要压入一个元素。(PS:这点很重要)
2:从步骤1 可得:ACTION为S2,就把 2 状态压入状态栈,得到 02 ,符号栈为 #a ,输入串为 bbcde# ,此时状态栈的栈顶元素为 2 ,由此从 LR(0)分析表 可得 2 状态对应的ACTION 为 S4 ,所以ACTION填入 S4。(PS: ACTION 由栈顶元素确定),GOTO为空。
步骤 | 状态栈 | 符号栈 | 输入串 | ACTION | GOTO |
---|---|---|---|---|---|
(3) | 024 | #ab | bcde# | r2 | 3 |
(4) | 023 | #aA | bcde# | S6 |
步骤(3,4)
1:输入串出栈,符号栈入栈,状态栈变为 024 ,此时4 对应的 r2 (PS:r-‘reduce’ 的意思是 缩小,减少)每当ACTION为 r 时 , GOTO就有值了。
2:此时r2中的 2 代表就是 G[S]文法的第二条产生式,即 A->b ,现在用 A 替换 b .得 aA . GOTO 的值 为A 对应的值 3。同时符号栈弹出了 1 个元素 b ,相应的状态栈也要弹出一个元素,即弹出 4 。
3:同时把GOTO 的值 3 压入 步骤4 的状态栈,得 023. 栈顶 3 对应的 ACTION 为 S6 。步骤4 的GOTO为空。
(PS:符号栈替换的时候,会记录归约字符的长度(此处为 b ,长度为1 ,所以状态栈也要出栈 1 个元素))。
(PS:GOTO的状态不要忘记压入状态栈了)
步骤 | 状态栈 | 符号栈 | 输入串 | ACTION | GOTO |
---|---|---|---|---|---|
(5) | 0236 | #aAb | cde# | r3 | |
(6) | 023 | #aA | cde# | S5 | 3 |
(7) | 0235 | #aAc | de# | S8 | |
(8) | 02358 | #aAcd | e# | r4 | 7 |
(9) | 02357 | #aAcB | e# | S9 | |
(10) | 023579 | #aAcBe | # | r1 | 1 |
步骤(5-10)
1:原理同上,只是步骤5符号栈归约的字符长度 为1(就是一个 b) ,而步骤10的长度 为5 ,就是字符串 aAcBe 的长度
步骤 | 状态栈 | 符号栈 | 输入串 | ACTION | GOTO |
---|---|---|---|---|---|
(11) | 01 | #S | # | acc |
步骤(11)
1:原理同上,最后只要可以得到输入串和符号栈连起来的字符是原字符就表示原字符是合法的。S -- ‘aAcBe’
输入串 # ,S + # --> aAcBe# , ACTION 为 acc 表示接受。