编译原理 实验二 预测分析算法的设计与实现 (8学时)

实验二 预测分析算法的设计与实现 (8学时)

一、实验目的
通过预测分析算法的设计与实现,加深对自上而下语法分析方法的理解,尤其是对自上而下分析条件的理解。
二、实验要求
输入文法及待分析的输入串,输出其预测分析过程及结果。
三、实验步骤

  1. 参考数据结构
    (1)/定义产生式的语法集结构/
typedef struct{
    char formula[200];//产生式
}grammarElement;
grammarElement  gramOldSet[200];//原始文法的产生式集

(2)/变量定义/

   char terSymbol[200];//终结符号
     char non_ter[200];//非终结符号
     char allSymbol[400];//所有符号
     char firstSET[100][100];//各产生式右部的FIRST集
     char followSET[100][100];//各产生式左部的FOLLOW集
     int M[200][200];//分析表
  1. 判断文法的左递归性,将左递归文法转换成非左递归文法。(该步骤可以省略,直接输入非左递归文法)。
    3.根据文法求FIRST集和FOLLOW集。
    (1)/求 First 集的算法/
begin
if  X为非终结符()
        在所有产生式中查找X所在的产生式
        if  产生式右部第一个字符为终结符或空(即X®a(aÎ )或X®e)
        	   then 把a或e加进FIRST(X)
        else if 产生式右部第一个字符为非终结符 
then
            if产生式右部的第一个符号等于当前字符 
then  跳到下一条产生式进行查找
            else if 当前非终结符还没有求其FIRST集 
then  查找它的FIRST集并标识此符号已求其FIRST集
       		           求得结果并入到X的FIRST集
        	   else if 当前产生式右部符号可推出空字且当前字符不是右部的最后一个字符
         	    then  获取右部符号下一个字符在所有字符集中的位置
         	    if  此字符的FIRST集还未查找 
				then 找其FIRST集,并标其查找状态为1 把求得的FIRST集并入到X的FIRST集
            else if 当前右部符号串可推出空且是右部符号串的最后一个字符(即产生式为X® ,若对一切1£ i£ k,均有e ÎFIRST( ),  
then 把空字加入到当前字符X的FIRST集
            else
                不能推出空字则结束循环
        标识当前字符X已查找其FIRST集
End//if

(2)/求 FOLLOW 集的算法/

begin
   if  X为开始符号 then # ÞFOLLOW(X) 
   对全部的产生式找一个右部含有当前字符X的产生式
   if X在产生式右部的最后(形如产生式A®aX) then
       查找非终结符A是否已经求过其FOLLOW集.避免循环递归
       if  非终结符A已经求过其FOLLOW集 then
            把FOLLOW(A)中的元素加入FOLLOW(X)
            继续查下一条产生式是否含有X
       else
            求A的FOLLOW集,并标记为A已求其FOLLOW集
    else if X不在产生式右部的最后(A®aBb) then
           if  右部X后面的符号串b能推出空字e then
                     查找b是否已求过其FOLLOW集.避免循环递归
                     if 已求过b的FOLLOW集 then
把FOLLOW(A)中的元素加入FOLLOW(B)
                    结束本次循环
              else if b不能推出空字 then
                     求 FIRST(b)
                     把FIRST(b)中所有非空元素加入到FOLLOW(B)中
     标识当前要求的非终结符X的FOLLOW集已求过
        end

4.构造预测分析表。
5.构造总控程序。
程序流程图如图1所示:
在这里插入图片描述

6.对给定的输入串,给出分析过程及结果。
四、实验报告要求
1.写出编程思路、源代码(或流程图);
2. 写出上机调试时发现的问题,以及解决的过程;
3. 写出你所使用的测试数据以及结果
4. 谈谈你的体会

测试数据:

STQRV
+*()i$
5
S->QT
T->+QT|$
Q->VR
R->*VR|$
V->(S)|i
(i+i)*i#

测试结果:
在这里插入图片描述
在这里插入图片描述
代码如下:

#include<bits/stdc++.h>

using namespace std;

typedef struct{
    string formula;//产生式
}grammarElement;
grammarElement  gramOldSet[200];//原始文法的产生式集

int sum;
int n;//文法产生式的个数
string terSymbol;//终结符号
string non_ter;//非终结符号
string allSymbol;//所有符号
string firstSET[100];//各产生式右部的FIRST集
string followSET[100];//各产生式左部的FOLLOW集
string M[200][200];//分析表
string str_cin;//输入串
stack <char> S;//符号栈

string duplictae(string s){//去除字符串中的重复字符
    if(s.size()<2)
        return s;
    string temp("\0");
    temp += s[0];
    string::size_type y;
    for(string::size_type x = 1; x < s.size(); x++){
        for( y = 0; y < temp.size(); y++){
            if(temp[y] == s[x]) 
                break;
        }
        if(y == temp.size())
            temp += s[x];
    }
    return temp;
}

string PrintStack(stack <char> ss){//打印符号栈
    stack <char> sta1;
    sta1 = ss;
    string str_temp;//暂存符号栈
    while(!sta1.empty()){
        str_temp.insert(0,1,sta1.top());
        sta1.pop();
    }
    return str_temp;
}

string PrintStrCin(string s,int num){//打印输入串
    string str;
    for(int i = num; i<s.length();i++){
        str += s[i];
    }
    return str;
}

void initSet(grammarElement s[],int n1){//处理 | 后的产生式集
    for(int i = 0; i < n1; i++){
        string temp = s[i].formula;;//暂时保存需要处理的产生式
        for(int j = s[i].formula.length() - 1; j >= 0; j-- ){
            if(s[i].formula[j]  == '|'){//确定带有 | 的产生式 
                s[n++].formula = temp.erase(3,j-2);//加上新的产生式
                temp = s[i].formula.erase(j);//去除 |
            }
        }
    }
}

void dealFirst(){//构造与文法有关的任何符号的FIRST集
    int num = allSymbol.length();
    while(num > 0){//每个集合FIRST不再增大
        for(int i = 0; i < allSymbol.length(); i++){
            char temp;保存文法符号
            temp = allSymbol[i];
            if(i >= non_ter.length()){//文法符号是终结符,规则(1)
                string::size_type idx1;
                idx1 = firstSET[i].find(temp);//在FIRST集中确认是否重复
                if(idx1 == string::npos)
                    firstSET[i] += temp; 
            }else{//文法符号是非终结符,规则(2)
                int cnt1 = 0;//产生式位置指针
                do{
                    string::size_type idx2;
                    idx2 = gramOldSet[cnt1].formula.find(temp);
                    if(idx2 == 0){//判断有产生式X->a..
                        if((terSymbol.find(gramOldSet[cnt1].formula[3]) != -1)&& 
                        (firstSET[i].find(gramOldSet[cnt1].formula[3]) == -1)){//a为终结符,且在FIRST集中确认终结符未重复
                                firstSET[i] += gramOldSet[cnt1].formula[3]; 
                        }
                        if((gramOldSet[cnt1].formula[3] == '$') && (gramOldSet[cnt1].formula.length() == 4)){//X->$
                            if(firstSET[i].find('$') == -1){//在FIRST集中确认任意符是否重复
                                    firstSET[i] += '$';
                                }
                        }
                    }
                    cnt1++;
                }while(cnt1 < allSymbol.length());
            }
            int cnt2 = 0;//产生式位置指针
            do{
                string::size_type idx3;
                idx3 = gramOldSet[cnt2].formula.find(temp);
                if(idx3 == 0){//构造FIRST集的规则(3),判断产生式X->Y...
                    if(non_ter.find(gramOldSet[cnt2].formula[3]) != -1){//Y为非终结符
                            string str1;//暂存Y
                            str1 = firstSET[allSymbol.find(gramOldSet[cnt2].formula[3])];
                            if(str1.find('$') != -1) str1.erase(str1.find('$'),1);  //去除$
                            if(firstSET[i].find(str1) == -1)//在FIRST集中确认终结符符是否重复
                                firstSET[i] += str1; 
                    }
                    for(int j = 3;j < gramOldSet[cnt2].formula.length(); j++){//判断有产生式X->Y1Y2..Yk,且Y为非终结符
                        if(non_ter.find(gramOldSet[cnt2].formula[j]) != -1){//判断i<=j<=k,Yj为非终结符
                            string str2;//暂存Yj
                            str2 = firstSET[allSymbol.find(gramOldSet[cnt2].formula[j])];
                            if(str2.find('$') == -1) break;
                            else{
                                str2.erase(str2.find('$'),1);
                                for(int k = 0; k < str2.length();k++){
                                    char ch = str2[k]; 
                                    if(firstSET[i].find(ch) == -1){
                                        firstSET[i] += ch;
                                    }
                                }
                            }
                            if((j == gramOldSet[cnt2].formula.length()-1) &&
                            (firstSET[i].find('$') == -1)){//j=1,2,3,..,k均含有$
                                firstSET[i] += '$';
                            }
                        }
                    }
                }
                cnt2++;        
            }while(cnt2 < allSymbol.length());
        }
        num--;
    }
    for(int j = 0;j < non_ter.length();j++){
        cout<<"非终结符\'"<<non_ter[j]<<"\'的FIRST集元素有:{ ";
        firstSET[j] = duplictae(firstSET[j]);//去除重复字符串
        for(int k = 0; k < firstSET[j].length(); k++)
            cout<<firstSET[j][k]<<" ";
        cout<<"}"<<endl;
    }
}

void dealFollow(){//构造与文法有关的非终结符FOLLOW集
    int num = non_ter.length();
    followSET[0] += '#';//文法符号是开始符号S,规则(1)
    while(num > 0){//每个FOLLOW集不再增大
        string temp;//暂存产生式的非终结符
        temp = non_ter[num];
        for(int i = 0; i < n; i++){
            for(int j = 3; j < gramOldSet[i].formula.length(); j++){//文法符号是非终结符,且不是开始符号,规则(2)
                if((non_ter.find(gramOldSet[i].formula[j]) != -1) && (gramOldSet[i].formula[j+1])){
                    string str1 = firstSET[allSymbol.find(gramOldSet[i].formula[j+1])];//暂存FIRST(β)
                    string str2 = followSET[allSymbol.find(gramOldSet[i].formula[0])];//暂存FOLLOw(A)
                    if(str1.find("$") != -1){//去除FIRST(β)\{$},规则(2),即$∈FIRST(β)
                        str1.erase(str1.find('$'),1);
                        if(followSET[allSymbol.find(gramOldSet[i].formula[j])].find(str1) == -1)//在FOLLOW集中确认未重复
                            followSET[allSymbol.find(gramOldSet[i].formula[j])] += str1;//把FIRST(β)\{$}加至FOLLOW(B)中
                        if(followSET[allSymbol.find(gramOldSet[i].formula[j])].find(str2) == -1)//$∈FIRST(β),规则(3)
                            followSET[allSymbol.find(gramOldSet[i].formula[j])] += str2;//把FOLLOW(A)加至FOLLOW(B)中
                    }
                    if(followSET[allSymbol.find(gramOldSet[i].formula[j])].find(str1) == -1)//在FOLLOW集中确认未重复
                        followSET[allSymbol.find(gramOldSet[i].formula[j])] += str1;//把FIRST(β)\{$}加至FOLLOW(B)中
                }
                if((non_ter.find(gramOldSet[i].formula[j]) != -1) && 
                (j == gramOldSet[i].formula.length() - 1)){//X->αB,α为终结符,B为非终结符
                    string str3 = followSET[allSymbol.find(gramOldSet[i].formula[0])];//暂存FOLLOw(A)
                    if(followSET[allSymbol.find(gramOldSet[i].formula[j])].find(str3) == -1)//在FOLLOW集中确认未重复
                        followSET[allSymbol.find(gramOldSet[i].formula[j])] += str3;//把FOLLOW(A)加至FOLLOW(B)中
                }
            }
        }
        num--;
    }  
    for(int j = 0;j < non_ter.length();j++){
        cout<<"非终结符\'"<<non_ter[j]<<"\'的FOLLOW集元素有:{ ";
        followSET[j] = duplictae(followSET[j]);//去除重复字符串
        for(int k = 0; k < followSET[j].length(); k++)
            cout<<followSET[j][k]<<" ";
        cout<<"}"<<endl;
    }
    cout<<endl;
}

void dealTable(){//构造分析表
    // terSymbol += '#';
    if(terSymbol.find("$") != -1)
        terSymbol.replace(terSymbol.find("$"),1,"#",1);//分析表无ε,取而代之是#
    allSymbol += '#';
    int cnt = 0;
    do{
        for(int i = 0; i < n; i++){//对文法的每个产生式A>α执行第2步和第三步
            if(firstSET[allSymbol.find(gramOldSet[i].formula[3])].find(terSymbol[cnt])
             != -1){//对每个终结符a∈FIRST(α),把A→α加至M[A,a]中
                M[non_ter.find(gramOldSet[i].formula[0])][cnt] = gramOldSet[i].formula;
            }
            if(firstSET[allSymbol.find(gramOldSet[i].formula[3])].find('$') != -1){//ε∈FIRST(α)
                int cnt1 = 0;
                do{//b∈FOLLOW(α),把A→α加至M[A,b]中
                    if(followSET[non_ter.find(gramOldSet[i].formula[0])].find(terSymbol[cnt1]) != -1){
                        M[non_ter.find(gramOldSet[i].formula[0])][cnt1] = gramOldSet[i].formula; 
                    }
                    cnt1++;
                }while(cnt1 < terSymbol.length());
            }
            else if(M[non_ter.find(gramOldSet[i].formula[0])][cnt].empty())
                M[non_ter.find(gramOldSet[i].formula[0])][cnt] = " ";
        }
        cnt++;
    }while(cnt < terSymbol.length());
    cout<<"分析表为:"<<endl;
    cout<<setw(8)<<std::left<<" ";
    for(int i = 0; i < terSymbol.length(); i++)
        cout<<setw(8)<<std::left<<terSymbol[i];
    cout<<endl;
    for(int i = 0;i < non_ter.length();i++){
        cout<<setw(8)<<std::left<<non_ter[i];
        for(int j = 0;j < terSymbol.length()+1;j++)
            cout<<setw(8)<<std::left<<M[i][j];
        cout<<endl;
    }
}

void allContronl(){//总控程序
    S.push('#');
    S.push(non_ter[0]);
    cout<<"请输入待分析的字符串(以#结尾):";
    cin>>str_cin;//输入串
    cout<<"利用分析表进行预测分析的步骤为:"<<endl;
    char X , a = str_cin[0];//STACK栈顶符号X和当前的输入符a,(X,a)
    bool flag = true;
    int pos = 0, counter = 0;//pos输入串指针,counter计数器
    cout<<setw(7)<<std::left<<"步骤"<<setw(16)<<std::left<<"符号栈"<<setw(10)<<std::right<<"输入串"<<setw(13)<<std::right<<"所用产生式";
    do{
        cout<<endl;
        if(S.empty()){//栈空完成
            cout<<"\nCongratulation!"<<endl;
            break;
        }
        cout<<setw(7)<<std::left<<counter<<setw(16)<<std::left<<PrintStack(S)<<setw(10)<<std::right<<PrintStrCin(str_cin,pos);
        counter++;
        X = S.top();//把STACK栈顶元素上托出去并放在X中
        S.pop();
        if(terSymbol.find(X) != -1){
            if(X == a){//把下一个输入符号读进a
                a = str_cin[++pos];
            }else{//错误
                cout<<setw(13)<<std::right<<"ERROR";
            }
        }else if(X == '#'){
            if(X == a){//正确,结束
                flag = false;
            }else{//错误
                cout<<setw(13)<<std::right<<"ERROR";
            }
        }else if(M[non_ter.find(X)][terSymbol.find(a)] != " "){//判断M[X,a]={x→X1X2…Xk}
            if(M[non_ter.find(X)][terSymbol.find(a)][3] == '$'){//若X1X2…Xk=$,不推什么进栈
                cout<<setw(13)<<std::right<<M[non_ter.find(X)][terSymbol.find(a)];
                continue;
            }else{//把Xk,Xk-1,...,X1一一推进STACK栈
                cout<<setw(13)<<std::right<<M[non_ter.find(X)][terSymbol.find(a)];
                for(int i = M[non_ter.find(X)][terSymbol.find(a)].length() - 1; i >= 3 ; i--){
                    S.push(M[non_ter.find(X)][terSymbol.find(a)][i]);
                }
            }
        }else{
            cout<<setw(13)<<std::right<<"ERROR"<<endl;
        }
    }while(flag);
}

int main(){
    cout<<"非终结符号如下:  ";
    cin>>non_ter;
    cout<<"终结符号如下:  ";
    cin>>terSymbol;
    allSymbol = non_ter + terSymbol;
    cout<<"文法产生式的个数:  ";
    cin>>n;
    cout<<endl;
    for(int i = 0;i < n;i++){
        cout<<"请输入第"<<i+1<<"产生式:"<<endl;
        cin>>gramOldSet[i].formula;
    }
    cout<<"\n\n去除 | 之后的产生式:"<<endl;
    initSet(gramOldSet,n);    
    for(int i = 0;i < n;i++){
        cout<<gramOldSet[i].formula<<endl;
    }
    cout<<endl;
    dealFirst();
    // for(int j = 0;j < allSymbol.length();j++){
    //     cout<<"非终结符\'"<<allSymbol[j]<<"\'的FIRST集元素有:{ ";
    //     for(int k = 0; k < firstSET[j].length(); k++)
    //         cout<<firstSET[j][k]<<" ";
    //     cout<<"}"<<endl;
    // }
    dealFollow();
    dealTable();
    allContronl();
    return 0;
}

实验报告链接:实验二 预测分析算法的设计与实现.doc

  • 4
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
实验一名称 词法分析程序(2学时实验目的 理解词法分析编译程序中的作用;加深对有穷自动机模型的理解; 掌握词法分析程序的实现方法和技术。 实验内容 选择部分C语言的语法成分,设计其词法分析程序,要求能够识别关键字、运算符、分界符、标识符、常量(至少是整型常量,可以自己扩充识别其他常量)等,并能处理注释、部分复合运算符(如>=等)。单词以二元式形式输出、输出有词法错误的单词及所在行号。 实验要求 (1)待分析的简单的语法 关键字:begin if then while do end … 运算符和界符::= + - * / < <= > >= <> = == ; ( ) # , … 其他单词是标识符id和整型常数num,通过以下正规式定义: id=l(l|d)* (l:letter d:digit) num=dd* 空格、注释:在词法分析中要去掉。 (2)各种单词符号对应的种别编码(参考这张表,可以不同) (3)待分析的源程序: (a)int main() { int a=1,b=2; b/a; /* 注释部分*/ b>a; c=a+b; cout<<c; return 0; } (b)这个待分析程序有词法错误(选做) while ((a+15)>0) { if (2x = = 7) i3=z; } 实验二名称 预测分析程序(2学时实验目的 掌握LL(1)文法分析思想;掌握预测分析程序的构造方法。 实验内容 设计实现能够识别表达式的预测分析程序。 实验要求 (1)总体要求: 1) 根据文法手工或程序方式构造预测分析表; 2) 采用程序方式构造预测分析表时,需计算First()和Follow()集合,有一定难度; 3) 根据预测分析表,设计实现预测分析总控程序,完成自上而下的语法分析器。 (2)文法的定义(可以选择此文法,也可以自己选择其他文法) (3)给出当输入串为:(i1+i2)*(i3+i4)的分析过程。(输出分析过程中的栈,输入串和利用的产生式等信息)

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值