编译原理实验1:词法分析

2017-3-6 实验内容:用flex工具生成一个PL/0语言的词法分析程序,对PL/0语言的源程序进行扫描,识别出单词符号的类别,输出各种符号的信息 输入:PL0源程序 输出:把单词符号分为下面五类,然后统计PL0源程序中各单词符号出现的次数。 K类(关键字) I类(标识符) C类(常量) P类(算符及界符) O类(其他)

实验环境: 词法分析器生成工具:flex 编程语言:C 调试环境:VC

PL/0 语言简介 PL/0语言是Pascal语言的子集 数据类型只有整型 标识符的有效长度是10,以字母开始的字母数字串 数最多为14位 过程无参,可嵌套(最多三层),可递归调用 变量的作用域同PASCAL,常量为全局的 语句类型: 赋值语句,if...then..., while...do..., read, write, call, 复合语句begin... end, 说明语句: const..., var..., procedure… 13个保留字: if, then, while, do, read, write, call, begin, end, const, var, procedure, odd

PL0语言的EBNF范式 EBNF:可说明哪些符号序列是对于某给定语言在语法上有效的程序。

EBNF范式的符号说明 < >:语法构造成分,为非终结符 ::= :该符号的左部由右部定义,读作“定义为” | :或 { }:括号内的语法成分可重复 [ ]:括号内成分为任选项 ( ):圆括号内成分优先 <表达式> ::= [+|-]<项>{<加法运算符><项>} <项> ::= <因子>{<乘法运算符><因子>} <因子> ::= <标识符>|<无符号整数>|’(‘<表达式>’)’ <加法运算符> ::= +|- <乘法运算符> ::= *|/ <关系运算符> ::= =|#|<|<=|>|>= <当型循环语句> ::= WHILE<条件>DO<语句> <过程调用语句> ::= CALL<标识符> <读语句> ::= READ’(‘<标识符>{,<标识符>}’)’ <写语句> ::= WRITE’(‘<表达式>{,<表达式>}’)’ <字母> ::= a|b|...|X|Y|Z <数字> ::= 0|1|...|8|9

LEX源程序的格式 %{ 声明 --可选 %} 辅助定义 --可选 %% 识别规则 --必须有 %% 用户子程序 --可选

声明 所有嵌在“%{”和“%}”之间的内容将被原样拷贝到lex.yy.c文件中。 在声明中,可以引入头文件、宏定义以及全局变量的定义。 例如: %{ #include <stdio.h> int num_ident, num_keyword; %}

辅助定义 辅助定义可以用一个名字代表一个正规式。 辅助定义的语法是:辅助定义名 正规式 注意:辅助定义必须从第一列写起。 后面的辅助定义可以引用前面的辅助定义。 在正规式中,用“{辅助定义名}”可以引用相应的正规式。 例如: NEW_LINE (\n) INTEGER ([0-9]+) EXPONENT ([Ee][+-] {INTEGER})

识别规则 识别规则由两部分组成:正规式和相应的动作。 正规式用于描述输入串的词法结构。 动作用于描述识别出某一个词形时要完成的操作。 例如: %% void {return T_Void;}

LEX源程序举例
%{ int num_lines = 0, num_chars = 0; %} %% \n {++num_lines; ++num_chars;} . {++num_chars;} %% main(){ yylex(); printf("# of lines = %d, # of chars = %d\n", num_lines, num_chars ); }

识别规则的二义性 有时输入串中的字符可以与多条规则匹配,在这 种情况下,LEX有两个处理原则: 能匹配最多字符的规则优先; 若各规则匹配的字符数目相同,先给出的规则优先。 例如,给定规则如下: void {return T_Void;} [A-Za-z]+ {return T_Identifier;} “void”将被识别为T_Void, “voida”将被识别为T_Identifier。

实验结果: 编写的C程序如下:

%{ #include <stdio.h> #include <stdlib.h> #include <string.h> #define MAX 20

/----对同类的不同内容建立结构体,方便统计和输出---/ typedef struct { char* contest; int cnt; }Node;

/----对不同类的内容建立结构体---/ typedef struct { int num; Node seque[MAX]; }Type; Type Key,Ident,Const,Oper,Others; void insert(Type *p); void print_it(char name[],Type *p); void print(); %}

/-------辅助定义------/ whitespace ([ \t\n])+ keyword (if|then|while|do|read|write|call|begin|end|const|var|procedure|odd) id ([A-Za-z][A-Za-z0-9]*) numbers ([0-9])+ %% {whitespace} {} {keyword} { insert(&Key); } {id} { insert(&Ident); } {numbers} { insert(&Const); } "."|","|";"|":="|"="|"+"|"-"|"*"|"/"|"#"|">"|">="|"<"|"<="|"("|")"|"^" { insert(&Oper); } . { insert(&Others); } %%

//输出 void print_it(char name[],Type *p) { int i; yyout = fopen("output.txt","a+"); fprintf(yyout,"Class %s:\n",name ); for(i=0;i<p->num;i++){ fprintf(yyout,"\t%d. %s\t %d\n",i+1,p->seque[i].contest,p->seque[i].cnt ); } fprintf(yyout,"\n" ); fclose(yyout); } void print() { print_it("keyword",&Key); print_it("id",&Ident); print_it("Const",&Const); print_it("Operation",&Oper); print_it("Others",&Others); } //判断是否已经是该Type中的一员,并作相应操作

  int strange = 1;
  int i=0;
  if(p->num>=MAX) {
    printf("Error!\n");
    return;
  }
  if(strlen(yytext)>=MAX) {
    printf("Too long!\n");
    //return;
  }
  for( i=p->num-1;i>=0;--i ) {
    if(!strcmp(p->seque[i].contest,yytext)){
      ++p->seque[i].cnt;
      strange = 0;
      break;
    }
  if(strange){
    p->seque[p->num].contest = (char*)malloc(100*sizeof(char));
    strcpy(p->seque[p->num].contest,yytext);
    ++p->seque[p->num].cnt;
    ++p->num;
  }
  return;
}```
`int yywrap() {
  return 1;
}
`
`void main(int agrc, char* argv[])
{
  yyin = fopen(argv[1],"r");
  yylex();
  printf("-----Here is the output-------- \n");
  print();
  fclose(yyin);`
  `
  return ;
}`

复制代码
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
附录c 编译程序实验 实验目的:用c语言对一个简单语言的子集编制一个一遍扫描的编译程序,以加深对编译原理的理解,掌握编译程序的实现方法和技术。 语法分析 C2.1 实验目的 编制一个递归下降分析程序,实现对词法分析程序所提供的单词序列的语法检查和结构分析. C2.2 实验要求 利用C语言编制递归下降分析程序,并对简单语言进行语法分析. C2.2.1待分析的简单语言的语法 实验目的 通过上机实习,加深对语法制导翻译原理的理解,掌握将语法分析所识别的语法成分变换为中间代码的语义翻译方法. 实验要求 采用递归下降语法制导翻译法,对算术表达式、赋值语句进行语义分析并生成四元式序列。 实验的输入和输出 输入是语法分析提供的正确的单词串,输出为三地址指令形式的四元式序列。 例如:对于语句串 begin a:=2+3*4;x:=(a+b)/c end# 输出的三地址指令如下: (1) t1=3*4 (2) t2=2+t1 (3) a=t2 (4) t3=a+b (5) t4=t3/c (6) x=t4 算法思想 1设置语义过程 (1) emit(char *result,char *arg1,char *op,char *ag2) 该函数功能是生成一个三地址语句送到四元式表中。 四元式表的结构如下: struct {char result[8]; char ag1[8]; char op[8]; char ag2[8]; }quad[20]; (2)char *newtemp() 该函数回送一个新的临时变量名,临时变量名产生的顺序为T1,T2,…. Char *newtemp(void) { char *p; char m[8]; p=(char *)malloc(8); k++; itoa(k,m,10); strcpy(p+1,m); p[0]=’t’; return(p); } (2)主程序示意图如图c.10所示。 (2) 函数lrparser在原来语法分析的基础上插入相应的语义动作:将输入串翻译成四元式序列。在实验中我们只对表达式、赋值语句进行翻译。 语义分析程序的C语言程序框架 int lrparser() { int schain=0; kk=0; if(syn=1) { 读下一个单词符号; schain=yucu; /调用语句串分析函数进行分析/ if(syn=6) { 读下一个单词符号; if(syn=0 && (kk==0)) 输出(“success”); } else { if(kk!=1 ) 输出 ‘缺end’ 错误;kk=1;} else{输出’begin’错误;kk=1;} } return(schain); int yucu() { int schain=0; schain=statement();/调用语句分析函数进行分析/ while(syn=26) {读下一个单词符号; schain=statement(); /调用语句分析函数进行分析/ } return(schain); } int statement() { char tt[8],eplace[8]; int schain=0; {switch(syn) {case 10: strcpy(tt,token); scanner(); if(syn=18) {读下一个单词符号; strcpy(eplace,expression()); emit(tt,eplace,””,””); schain=0; } else {输出’缺少赋值号’的错误;kk=1; } return(schain); break; } } char *expression(void) {char *tp,*ep2,*eplace,*tt; tp=(char *)malloc(12);/分配空间/ ep2=(char *)malloc(12); eplace=(char *)malloc(12); tt =(char )malloc(12); strcpy(eplace,term ());/调用term分析产生表达式计算的第一项eplace/ while(syn=13 or 14) { 操作符 tt= ‘+’或者‘—’; 读下一个单词符号; strcpy(ep2,term());/调用term分析产生表达式计算的第二项ep2/ strcpy(tp,newtemp());/调用newtemp产生临时变量tp存储计算结果/ emit(tp,eplace,tt,ep2);/生成四元式送入四元式表/ strcpy(eplace,tp); } return(eplace); } char *term(void)/仿照函数expression编写/ char *factor(void) {char *fplace; fplace=(char *)malloc(12); strcpy(fplace, “ ”); if(syn=10) {strcpy(fplace,,token);/将标识符token的值赋给fplace/ 读下一个单词符号; } else if(syn=11) {itoa(sum,fplace,10); 读下一个单词符号; } else if (syn=27) {读下一个单词符号; fplace=expression();/调用expression分析返回表达式的值/ if(syn=28) 读下一个单词符号; else{输出‘}’错误;kk=1; } } else{输出‘(’错误;kk=1; } return(fplace); }

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值