深入浅出编译原理-5-一个简单语法分析器的C语言实现

引言

前面已经介绍了编译器的预处理,词法分析,词法分析器的实现,也在其中说到了语法分析的任务和过程。

语法分析的输入是词法单元序列,然后根据语言的文法表示(展开式),利用有限状态机理论,生成抽象语法树,然后遍历得到中间代码,即,三地址码。本节就以一个实验的方式,来看一下,语法分析器的内在实现机制。

5.1实验描述

编制一个递归下降分析程序,实现对词法分析程序所提供的单词序列的语法检查和结构分析。

利用C语言编制递归下降分析程序,并对简单语言进行语法分析。

5.1.1 待分析的简单语言的语法

用扩充的BNF表示如下:

<程序>::=begin<语句串>end

<语句串>::=<语句>{<语句>}

<语句>::=<赋值语句>

<赋值语句>::=ID=<表达式>

<表达式>::=<>{+<> | -<>}

<>::=<因子>{*<因子> | /<因子>

<因子>::=ID | NUM | <表达式>

5.1..2 实验要求说明

输入单词串,以“#”结束,如果是文法正确的句子,则输出成功信息,打印“success”,否则输出“error”。

例如:

输入 begin a:=9; x:=2*3; b:=a+x end #

输出 success

输入 x:=a+b*c end #

输出 error

5.2 C语言代码实现

核心思想就是,从开始状态开始,按照文法展开式,逐级进行状态分析,直到分析完毕,如果在此期间出现状态不匹配,即语法错误,停止分析。当然在实际的语法分析器要有错误恢复机制,以发现其他的语法错误。即,一次报告多个语法错误。这里需要说明的是,要想实现语法分析,必须先有词法分析,所以,这段代码包含了上一节的内容,词法分析部分。

#include "stdio.h"
#include "string.h"


char prog[100],token[8],ch;
char *rwtab[6]={"begin","if","then","while","do","end"};
int syn,p,m,n,sum;
int kk;

void factor(void);
void expression(void);
void yucu(void);
void term(void);
void statement(void);
void lrparser(void);
void scaner(void);


int main(void)
{
	p=kk=0;
	printf("\nplease input a string (end with '#'): \n");

	do
	{
		scanf("%c",&ch);
		prog[p++]=ch;
	}while(ch!='#');

	p=0;
	scaner();
	lrparser();
	//getch();
}

void lrparser(void)
{
	if(syn==1)
	{ 
		scaner();       /*读下一个单词符号*/
		yucu();     /*调用yucu()函数;*/

		if(syn==6)
		{
			scaner();
			if((syn==0)&&(kk==0))
			printf("success!\n");
		}
		else
		{
			if(kk!=1) printf("the string haven't got a 'end'!\n");
			kk=1;
		}
	}
	else
	{ 
		printf("haven't got a 'begin'!\n");
		kk=1;
	}
	
	return;
}

void yucu(void)
{ 
	statement();         /*调用函数statement();*/

	while(syn==26)
	{
		scaner();          /*读下一个单词符号*/
		if(syn!=6) 
			statement();         /*调用函数statement();*/
	} 
	
	return;
}

void statement(void)
{
	if(syn==10)
	{
		scaner();        /*读下一个单词符号*/
		if(syn==18)
		{
			scaner();      /*读下一个单词符号*/
			expression();      /*调用函数statement();*/
		}
		else
		{
			printf("the sing ':=' is wrong!\n");
			kk=1;
		}
	}
	else
	{ 
		printf("wrong sentence!\n");
		kk=1;
	}
	
	return;
}

void expression(void)
{
	term();

  	while((syn==13)||(syn==14))
    {
    	scaner();             /*读下一个单词符号*/
      	term();               /*调用函数term();*/
    }
	
 	return;
}

void term(void)
{ 
	factor();

  	while((syn==15)||(syn==16))
    { 
    	scaner();             /*读下一个单词符号*/
      	factor();              /*调用函数factor(); */
    }
	
	return;
}

void factor(void)
{ 
	if((syn==10)||(syn==11))
	{
		scaner();
	}
  	else if(syn==27)
    { 
    	scaner();           /*读下一个单词符号*/
     	expression();        /*调用函数statement();*/

		if(syn==28)
		{
			scaner();          /*读下一个单词符号*/
		}
      	else 
	  	{
	  		printf("the error on '('\n");
      		kk=1;
     	}
    }
  	else
	{ 
		printf("the expression error!\n");
  		kk=1;
    }
	
  	return;
}
void scaner(void)
{
	sum=0;

	for(m=0;m<8;m++)
		token[m++]=NULL;
	
	m=0;
	ch=prog[p++];
	
	while(ch==' ')
		ch=prog[p++];
	
	if(((ch<='z')&&(ch>='a'))||((ch<='Z')&&(ch>='A')))
	{ 
		while(((ch<='z')&&(ch>='a'))||((ch<='Z')&&(ch>='A'))||((ch>='0')&&(ch<='9')))
		{
			token[m++]=ch;
			ch=prog[p++];
		}
		p--;
		syn=10;
		token[m++]='\0';
		for(n=0;n<6;n++)
		if(strcmp(token,rwtab[n])==0)
		{
			syn=n+1;
			break;
		}
	}
	else if((ch>='0')&&(ch<='9'))
	{
		while((ch>='0')&&(ch<='9'))
		{ 
			sum=sum*10+ch-'0';
			ch=prog[p++];
		}
		p--;
		syn=11;
	}
	else
	switch(ch)
	{
		case '<':
			m=0;
			ch=prog[p++];
			if(ch=='>')
			{ 
				syn=21;
			}
			else if(ch=='=')
			{ 
				syn=22;
			}
			else
			{ 
				syn=20;
				p--;
			}
		break;
		
		case '>':
			m=0;
			ch=prog[p++];
			if(ch=='=')
			{ 
				syn=24;
			}
			else
			{
				syn=23;
				p--;
			}
		break;
		
		case ':':
			m=0;
			ch=prog[p++];
			if(ch=='=')
			{
				syn=18;
			}
			else
			{
				syn=17;
				p--;
			}
			break;
			
		case '+':
			syn=13;
		break;
		
		case '-': 
			syn=14;
		break;
		
		case '*':
			syn=15;
		break;
		
		case '/': 
			syn=16;
		break;
		
		case '(': 
			syn=27;
		break;
		
		case ')': 
			syn=28;
		break;
		
		case '=':
			syn=25;
		break;
		
		case ';': 
			syn=26;
		break;
		
		case '#':
			syn=0;
		break;
		
		default:
			syn=-1;
		break;
	}
}


5.3小结

语法分析的核心工作就是:从开始状态开始,利用有限状态机理论,根据语言的文法展开式,进行状态分析,得到语法树。然后进而生成中间代码(三地址码),为后面的汇编做好准备。本小节的内容只是进行状态分析。但对理解语法分析器有很大帮助。代码的具体流程图,读者可自己画一下,其中味道,可意不可言......

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
递归下降分析法 一、实验目的: 根据某一文法编制调试递归下降分析程序,以便对任意输入的符号串进行分析。本次实验的目的主要是加深对递归下降分析法的理解。 二、实验说明 1、递归下降分析法的功能 词法分析器的功能是利用函数之间的递归调用模拟语法树自上而下的构造过程。 2、递归下降分析法的前提 改造文法:消除二义性、消除左递归、提取左因子,判断是否为LL(1)文法, 3、递归下降分析法实验设计思想及算法 为G的每个非终结符号U构造一个递归过程,不妨命名为U。 U的产生式的右边指出这个过程的代码结构: (1)若是终结符号,则和向前看符号对照, 若匹配则向前进一个符号;否则出错。 (2)若是非终结符号,则调用与此非终结符对应的过程。当A的右部有多个产生式时,可用选择结构实现。 三、实验要求 (一)准备: 1.阅读课本有关章节, 2.考虑好设计方案; 3.设计出模块结构、测试数据,初步编制好程序。 (二)上课上机: 将源代码拷贝到机上调试,发现错误,再修改完善。第二次上机调试通过。 (三)程序要求: 程序输入/输出示例: 对下列文法,用递归下降分析法对任意输入的符号串进行分析: (1)E->eBaA (2)A->a|bAcB (3)B->dEd|aC (4)C->e|dc 输出的格式如下: (1)递归下降分析程序,编制人:姓名,学号,班级 (2)输入一以#结束的符号串:在此位置输入符号串例如:eadeaa# (3)输出结果:eadeaa#为合法符号串 注意: 1.如果遇到错误的表达式,应输出错误提示信息(该信息越详细越好); 2.对学有余力的同学,可以详细的输出推导的过程,即详细列出每一步使用的产生式。 (四)程序思路 0.定义部分:定义常量、变量、数据结构。 1.初始化:从文件将输入符号串输入到字符缓冲区中。 2.利用递归下降分析法分析,对每个非终结符编写函数,在主函数中调用文法开始符号的函数。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值