语法分析-LL（1）分析的python实现

最新推荐文章于 2024-07-30 17:31:03 发布

Type真是太帅了

最新推荐文章于 2024-07-30 17:31:03 发布

阅读量9.7k

点赞数 4

分类专栏：编程

本文链接：https://blog.csdn.net/qq_36614557/article/details/85551105

版权

编程专栏收录该内容

15 篇文章 0 订阅

订阅专栏

语法分析：将切分的单词序列组合成各类短语短语，常见的方法：自上而下，自下而上。

LL（1）：左扫描，左推导。

大体步骤：

1.从文件或其他方式导入\储存文法（实质就是几行符号流）并把其中的终结字符和非终结字符存在数组\列表里

2.把文法每行的“或”（|）切分成两个即A->B|C 切分为A->B和A->C

for i in gramma:
    ss=i[0:1]
    j=0
    while j<len(i):
        if i[j]=='>':
            break
        j+=1
    j+=1 #找到->后的第一个位置
    while j<len(i):
        if i[j]=='\n':
            break
        if i[j]!='|':
            ss+=i[j]
        else:
            stack.append(ss)
            ss=i[0:1]
        j+=1
    stack.append(ss)

3.根据文法创建first集和follow 集

(1)first：在切分后的文法中如果A->a…… （a为终结字符）则把a放入A的follow中如果A->B ……（B为非终结）则先递归求B的first，然后放入A的first

（2）follow::先把‘$’放入开始字符（E）的follow；存在 ……Ab（b为非终结），则把b放入A的follow ；存在AB（B为非终结），则把B的first放入A的follow；存在B=EAC，且C的first中含有‘ε’，则把B的follow放入A的follow；若A为某段的最后字符，则把‘$’放入A的follow；若B=……A，则把B的follow放入A的follow

def GetFirst(stack_item):
    if stack_item[1] in vt:#产生式第一个为终结
        first[stack_item[0]].add(stack_item[1])#将其放入第一个的first
    else:
        for find_item in stack:
            if find_item[0]==stack_item[1]:
                GetFirst(find_item)
                first[stack_item[0]]=first[stack_item[1]]|first[stack_item[0]]

def GetFollow(vi_item):
    for i in stack:
        j=1
        while j<len(i)-1:
            if (i[j]==vi_item)&(i[j+1] in vt): # 存在 Ab 则把b放入
                follow[vi_item].add(i[j+1])
            if (i[j]==vi_item)&(i[j+1] in vi): #存在AB 则把B的first放入
                follow[vi_item]=follow[vi_item]|first[i[j+1]]-{'ε'}
            if (i[j] in vi)&('ε' in first[i[j+1]]): #存在 A=EBC 且C的first中有空
                follow[i[j]]=follow[i[0]]|follow[i[j]]
            j+=1
        if i[len(i)-1] ==vi_item:#为某行最后一个字符
            follow[vi_item].add('$')  
        if (i[0]==vi_item)&(i[len(i)-1] in vi):#A=....B
            follow[i[len(i)-1]]=follow[vi_item]|follow[i[len(i)-1]]
        if (i[len(i)-1]==vi_item)&(i[0] in vi):
            follow[vi_item]=follow[i[0]]|follow[i[len(i)-1]]

4.求预测分析表（代码使用双重字典）

对于每个产生式A->alpha 执行(1)(2)

(1)对first（alpha）中的每一个终结字符a，把A->alpha放入M[A,a]

(2)如果ε在first（alpha）中，对于follow（alpha）的每一个终结字符b，把A->alpha放入M[A,b](包括$)

写了半天并没有写出来于是就手动建了。。。

6.对输入的记号流进行分析：

设w为记号流 ip为指向第一个符号设S为栈初始只有开始元素E和$（$在最低）

while(栈顶不是$){

如果栈顶与ip指向符号相同，则栈弹出，ip指向下一个

否则如果栈顶为终结符，则出错

否则如果栈顶和ip指向符号所在的分析表不存在，则出错

否则如果存在，先输出预测表中对应的产生式，然后弹出栈顶元素，并把产生式->后的元素逆序压入栈中

}

完整代码：

# -*- coding: utf-8 -*-
"""
Created on Tue Jan  1 12:32:13 2019

@author: 71405
"""
from collections import defaultdict
def addtwodimdict(thedict, key_a, key_b, val): 
    if key_a in thedict:
        thedict[key_a].update({key_b: val})
    else:
        thedict.update({key_a:{key_b: val}})


def GetFirst(stack_item):
    if stack_item[1] in vt:#产生式第一个为终结
        first[stack_item[0]].add(stack_item[1])#将其放入第一个的first
    else:
        for find_item in stack:
            if find_item[0]==stack_item[1]:
                GetFirst(find_item)
                first[stack_item[0]]=first[stack_item[1]]|first[stack_item[0]]

def GetFollow(vi_item):
    for i in stack:
        j=1
        while j<len(i)-1:
            if (i[j]==vi_item)&(i[j+1] in vt): # 存在 Ab 则把b放入
                follow[vi_item].add(i[j+1])
            if (i[j]==vi_item)&(i[j+1] in vi): #存在AB 则把B的first放入
                follow[vi_item]=follow[vi_item]|first[i[j+1]]-{'ε'}
            if (i[j] in vi)&('ε' in first[i[j+1]]): #存在 A=EBC 且C的first中有空
                follow[i[j]]=follow[i[0]]|follow[i[j]]
            j+=1
        if i[len(i)-1] ==vi_item:#为某行最后一个字符
            follow[vi_item].add('$')  
        if (i[0]==vi_item)&(i[len(i)-1] in vi):#A=....B
            follow[i[len(i)-1]]=follow[vi_item]|follow[i[len(i)-1]]
        if (i[len(i)-1]==vi_item)&(i[0] in vi):
            follow[vi_item]=follow[i[0]]|follow[i[len(i)-1]]
                

vt=['i','+','*','(',')','ε'] #终结字符
vi=['E','e','T','t','F'] #非终结字符
gramma=open('gram.txt').readlines()
stack=[]
for i in gramma:
    ss=i[0:1]
    j=0
    while j<len(i):
        if i[j]=='>':
            break
        j+=1
    j+=1 #找到->后的第一个位置
    while j<len(i):
        if i[j]=='\n':
            break
        if i[j]!='|':
            ss+=i[j]
        else:
            stack.append(ss)
            ss=i[0:1]
        j+=1
    stack.append(ss)
first=defaultdict(set) #构建元素映射到多个元素（集合）的字典
follow=defaultdict(set)
for stack_item in stack:
    GetFirst(stack_item)
    
follow['E'].add('$')   
for vi_item in vi:
    GetFollow(vi_item)
ana_table=dict() #建立预测分析表 其中key为非终结符和输入符号字符串的相连接 value为对应的分析结果


addtwodimdict(ana_table, 'E', 'i', 'E->Te')
addtwodimdict(ana_table, 'E', '(', 'E->Te')
addtwodimdict(ana_table, 'e', '+', 'e->+Te')
addtwodimdict(ana_table, 'e', ')', 'e->ε')
addtwodimdict(ana_table, 'e', '$', 'e->ε')
addtwodimdict(ana_table, 'T', 'i', 'T->Ft')
addtwodimdict(ana_table, 'T', '(', 'T->Ft')
addtwodimdict(ana_table, 't', '+', 't->ε')
addtwodimdict(ana_table, 't', '*', 't->*Ft')
addtwodimdict(ana_table, 't', ')', 't->ε')
addtwodimdict(ana_table, 't', '$', 't->ε')
addtwodimdict(ana_table, 'F', 'i', 'F->i')
addtwodimdict(ana_table, 'F', ')', 'F->(E)')

    
sen="i*i+i$"
ip=0 
ss=['$','E']
while ss[len(ss)-1]!='$':
    print(ss)
    print(sen[ip])
    if ss[len(ss)-1]==sen[ip]:
        ss.pop()
        ip+=1
    elif ss[len(ss)-1] in vt:
        print("error1")
        break
    elif sen[ip] not in ana_table[ss[len(ss)-1]]:
        print("error2")
        break
    elif sen[ip] in ana_table[ss[len(ss)-1]]:
        strings=ana_table[ss[len(ss)-1]][sen[ip]]
        print(strings)
        ss.pop()
        j=len(strings)-1
        while j>2:
            if strings[j]!='ε':
                ss.append(strings[j])
            j-=1

使用的文法为《编译原理》高等教育出版社第三章3.8文法其中为了方便考虑E‘表示为e T’同理

文法(gramma)：

切分后（stack）：->已经省略

first集与follow集合：（不知道为啥多了一行，但没有value ，还没来得及修改）

最后分析结果：

Type真是太帅了

关注

4
点赞
踩
42

收藏

觉得还不错? 一键收藏
10
评论
语法分析-LL（1）分析的python实现

语法分析：将切分的单词序列组合成各类短语短语，常见的方法：自上而下，自下而上。LL（1）：左扫描，左推导。大体步骤：1.从文件或其他方式导入\储存文法（实质就是几行符号流）并把其中的终结字符和非终结字符存在数组\列表里2.把文法每行的“或”（|）切分成两个即A-&gt;B|C 切分为A-&gt;B和A-&gt;Cfor i in gramma: ss=i[0:1]...
复制链接

扫一扫

专栏目录