编译原理笔记(四)之静态语义分析

静态语义分析的两个作用:检查出源程序中的静态语义错误和将语义正确的语句翻译成中间代码

1. 语法制导翻译简介

1.1 语法与语义

  • 语义揭示了程序本身的涵义、施加于语言结构上的限制或者要执行的动作。
  • 语义分析的双重作用:
    • 检查语言结构的语义是否正确,即是否结构正确的句子所表示的意思也合法。
    • 执行所规定的语义动作,如表达式的求值、符号表的填写、中间代码的生成等。
  • 语义分析方法:语法制导翻译,基本思想是将语言结构的语义以属性的形式赋予代表此结构的文法符号,而属性的计算以语义规则的形式赋予由文法符号组成的产生式。

1.2 属性与语义规则

  • 定义:对于产生式A→a,其中α是由文法符号X1X2…Xn组成的序列,它的语义规则可以表示为式(4.1)所示关于属性的函数:
    b := f(cl, c2,…-", ck)
    语义规则中的属性存在下述性质与关系:
    (1)若b是A的属性,c1, c2,…, ck 是α中文法符号的属性或者A的其他属性,则称b是A的综合属性。
    (2)若b是α中某文法符号Xi的属性,c1, c2,…, ck是A的属性或者是α中其他文法符号的属性,则称b是Xi的继承属性。
    (3)称式(4.1)中属性b依赖于属性c1, c2,…, ck。
    (4)若语义规则的形式如下述式(4.2),则可将其想像为产生式左部文法符号A的一个虚拟属性,属性之间的依赖关系在虚拟属性上依然存在:
    f(cl, c2,…, ck)
    文法符号属性的抽象表示采用点加标识符(.属性)的方法

  • 继承属性:自上而下,包括兄弟

  • 综合属性:自下而上,包括自身

1.3 语义规则的两种形式

  1. 语法制导定义:用抽象的属性和运算符号表示的语义规则(算法)
  2. 翻译方案:用具体属性和运算表示的语义规则(程序)

1.4 LR分析翻译方案的设计

可以把语法制导翻译看做语法分析的扩充

  1. 扩充LR分析器的功能
  2. 扩充分析栈(新增加一个语义栈)

1.5 递归下降分析翻译方案的设计

从上到下构造一棵树
对虚拟分析树的一次深度优先遍历

2. 中间代码简介

  • 中间代码实际上应起分隔编译器前端与后端分水岭的作用
  • 目的:便于编译器的开发移植和代码的优化
  • 特性:1. 便于语法制导翻译 2. 既与机器指令的结构相近,又与具体机器无关
  • 主要形式:(最基本)、后缀式三地址码(最常用,采用四元式形式)等

2.1 后缀式

  • 也叫逆波兰表示,典型特征是操作数在前,操作符紧跟其后
  • 例如:a+bc的后缀式表示为abc+,而(3+5)*(8+2)的后缀式为35+82*
  • 优点:没有括号且便于计算

2.2 三地址码

  • 三地址码是由不超过三个地址组成的一个运算:
  • 形式:
    result:=arg1 op arg2 或者result:=op arg1 或者op arg1
  • arg1和arg2用于存放运算对象
  • result用于存放运算结果
  • 三地址码是最终生成目标代码的理性中间代码形式

三地址码的种类

序号三地址码四元式
(1)x :=y op z(op, y,z,x)
(2)x :=op y(op, y, ,x)
(3)x := y(:=,y, ,x)
(4)goto L(j, , ,L)
(5)if x goto L(jnz, x, ,L)
(6)if x relop y goto L(jrelop, x, y, L)
(7)param x(param, , ,x)
(8)call P,n(call, n, , P)
(9)return y(return, , ,y)
(10)x :=y[i](=[], y[i], ,x)
(11)x[i]:=y([]=, y, ,x[i])
(12)x := &y(=&, y , , x)
(13)x :=*y(=*, y , , x)
(14)*x :=y(*=, y , , x)

2.2.1 三元式表示

表示:
(i)(op, arg1, arg2)
代表的计算是:
(i):=arg1 op arg2
即arg1和arg2分别作为左右操作数进行op运算,运算结果存放在三元式的编号(i)中。

2.2.2 三元式的语法制导翻译

为文法符号和产生式设计如下的属性和语义函数:

  1. 属性.code:表示三元式代码,指示标识符的存储单元或三元式表中的序号。
  2. 属性.name:给出标识符的名字。
  3. 函数 trip( op,arg1,arg2):生成一个三元式,返回三元式的序号。若运算是一元的,如E一-E1,则arg2可以为空。
  4. 函数entry(id.name):根据标识符id.name查找符号表并返回它在符号表中的位置或存储位置。为了直观,三元式中仍以标识符自身的名字表示。

对于简单赋值句的求值,三元式语法制导翻译如下:

(1) A->id :=E 	{A.code := trip( :=,entry(id.name),E.code ) }
(2) E->E1+E2 	{E.code := trip(+,E1.code,E2.code ) }
(3) E->E1*E2	{E.code := trip(*,E1.code,E2.code ) }
(4)	E->(E1 )	{E.code := E1.code }
(5) E->E1		{E.code := trip( @,E1.code,)}
(6)	E->id 		{E.code := entry(id.name)}

2.2.3 四元式表示

  • 形式:
    (op,arg1,arg2,result)
  • 所表示的计算:
    result:=arg1 op arg2
  • 运行结果存放在result(临时变量)中
  • 四元式和三元式的唯一区别是将由序号所表示的运算结果改为了由临时变量来表示。

2.2.4 四元式的语法制导翻译

对于简单赋值句的求值,四元式语法制导翻译如下:

(1)A→id:=E	{A.code := newtemp; emit(:=cntry(id.name)E.code, A.code)}(2)E→E1+E2 	{E.code := newtemp; emit( +,E1.code,E2.code, E.code)}
(3)E→E1*E2 	{E.code := newtemp; emit(*,E1.code,E2.code,E.code)}
(4)E(E1)	{E.code := E1.code }
(5)E-E1	{E.code := newtemp; emit( @,E1.code,, E.code) }
(6)E→id		{E.code := entry(id.name)}
/*此处,属性.code表示存放运算结果的变量;
	   函数 newtemp表示返回一个新的临时变量,如T1、T2等;
	   过程emit( op, arg1 , arg2, result)生成一个四元式,若运算是一元的,如E→-E1,则arg2可以为空。*/

栗子:赋值句x:=a+bc 可由一组四元式表示如下:
(
, b, c, T1)
(+,a,T1, T2)
(:=,x,T2, T3)

2.3 图形表示

2.3.1 树作为中间代码

在这里插入图片描述

2.3.2 树的语法制导翻译

对简单赋值句的求值进行语法制导翻译如下:

(1)A→id :=E		{A.nptr := mknode( :=,mkleaf(entry(id.name)),E.nptr ) }
(2)E→El+E2	 	{ E.nptr := mknode( +,E1.nptr,E2.nptr ) }
(3)E→E1 * E2 	{E.nptr := mknode(*,E1.nptr,E2.nptr ) }
(4)E→(E1)		{E.nptr := E1.nptr }
(5)E→-E1		{E.nptr := mknode( @,E1.nptr, )}
(6) E→ id		{E.nptr := mkleaf(entry((id.name))}

其中,属性.nptr是指向树节点的指针;
函数 mknode(op,nptr1,nptr2) 生成一个根或内部节点,节点的数据是op,左右孩子分别是nptr1和 nptr2所指向的子树,若仅有一个孩子,则nptr2为空:函数mkleaf(node)生成一个叶子节点。

2.3.3 树的优化表示—DAG

如果若干个节点有完全相同的孩子,则这些节点可以指向同一个孩子(如图4.24(b)所示),形成一个有向无环图(DAG)。DAG与树的唯一区别是多个父亲可以共享同一个孩子,从而达到资源(运算、代码等)共享的目的。

2.3.4 树与其他中间代码的关系

对树进行深度优先的后序遍历,得到的线性序列就是后缀式,或者说后缀式是树的一个线性化序列;而对于每棵父子关系的子树,父亲节点作为操作符,两个孩子节点作为操作数,恰好组成一个三元式,且父亲节点的序号成为三元式的序号。为每个三元式序号赋一个临时变量,就不难将三元式转换为四元式。

3. 符号表简介

符号表示连接声明与引用的桥梁。

3.1 符号表条目

  • 条目:每个声明的名字在符号表中占据一栏
    条目的名字可以不唯一,格式无需统一
  • C语言构造的符号表中,一个名字的组合关键字至少包括三项:名字+作用域+类型

3.2 构成名字的字符串

直接存储方式:直接将构成名字的字符串存放在符号表中的方式(a)
间接存储方式:将构成名字的字符串统一存放在一个大的连续空间中(c),字符串与字符串之间用特殊的分隔符隔开,而在符号表的条目,仅存放指向该字符串首字符的指针即可(b)和(c)

在这里插入图片描述

3.3 名字的作用域

划分范围的两种方式:并列和嵌套

  1. 静态作用域原则:编译时就可以确定名字的作用域,也可以说,仅从静态读程序就可确定名字的作用域。
  2. 最近嵌套原则

3.4 线性表

最简单和最容易实现符号表的数据结构是线性表。
可以将线性表表示为一个数组,也可以表示为一个单链表。
为了正确反映名字的作用域,线性表应具有栈的性质,即符号的加入和删除均在线性表的一端进行。
在这里插入图片描述

3.5 散列表

  1. 构成
    为了提高符号表的查找效率,可以将线性表化整为零,分成m个子线性表,简称子表。构造一个散列函数,使符号表中元素均匀地散布在这 m个子表中。散列表的结构如图4.26所示,m个子表的表头构成一个表头数组,它以散列函数的值(hash 值)为下标,每个子表的组织与上述线性表相同。具有相同hash 值的节点被散列在相同子表中,连接子表的链被称为散列链。如果散列均匀,则时间复杂度会降到原线性表的1/m。
    在这里插入图片描述

  2. 散列表的操作
    (1)查找
    (2)插入
    (3)删除

4. 声明语句的翻译

4.1 变量的声明

  1. 变量的类型定义与声明
    类型定义:为编译器提供存储空间大小的信息
    变量声明:为变量分配存储空间
  2. 变量声明的语法制导翻译

4.2 数组变量的声明

符号表提供四个域(name,type,offset,width)
分辨表示名字、类型、相对存储位置、变量的宽度

  1. 静态数组的内情向量
    内情向量是一种数据结构
    n维整型数组声明:array [d1] of array [d2] of … array[dn] of integer

在这里插入图片描述
n:表示数组的维度
c:计算数组元素在被分配的数组存储空间中的相对位置所需的一个常数
offset:数组的首地址偏移量
di:每维的成员个数
type:数组元素的类型

4.3 过程的定义与声明

  • 规格说明:或过程头,过程的界面
  • 过程体:过程所要完成操作的具体实现
  • 函数:有返回值的过程
  • 主程序:可以被认为是操作系统调用的过程
  • 三种形式:过程定义、过程声明和过程调用
  1. 左值与右值

左值是地址,右值是指,也可以说左值是容器,右值是内容。

  1. 参数传递
    形参
    实参
    值调用
    引用调用
    复写-恢复
    换名调用

  2. 作用域信息的保存
    (1)过程的作用域
    (2)符号表中的作用域信息

5. 简单算术表达式与赋值句

5.1 简单变量的语法制导翻译

在这里插入图片描述

5.2 变量的类型转换

强制:整型量转换为实型量
T:=itr E 将E从整型变为实型,结果存放在T中
T:=rti E 将E从实型变为整型,结果存放在T中

6. 数组元素的引用

数组元素的地址计算

7. 布尔表达式

  1. 逻辑运算
  2. 控制语句转移的控制条件

8. 控制语句

  1. 无条件转移语句
  2. 条件转移语句
  3. 循环语句
  4. 分支语句
  • 2
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
附录c 编译程序实验 实验目的:用c语言对一个简单语言的子集编制一个一遍扫描的编译程序,以加深对编译原理的理解,掌握编译程序的实现方法和技术。 语法分析 C2.1 实验目的 编制一个递归下降分析程序,实现对词法分析程序所提供的单词序列的语法检查和结构分析. C2.2 实验要求 利用C语言编制递归下降分析程序,并对简单语言进行语法分析. C2.2.1待分析的简单语言的语法 实验目的 通过上机实习,加深对语法制导翻译原理的理解,掌握将语法分析所识别的语法成分变换为中间代码的语义翻译方法. 实验要求 采用递归下降语法制导翻译法,对算术表达式、赋值语句进行语义分析并生成四元式序列。 实验的输入和输出 输入是语法分析提供的正确的单词串,输出为三地址指令形式的四元式序列。 例如:对于语句串 begin a:=2+3*4;x:=(a+b)/c end# 输出的三地址指令如下: (1) t1=3*4 (2) t2=2+t1 (3) a=t2 (4) t3=a+b (5) t4=t3/c (6) x=t4 算法思想 1设置语义过程 (1) emit(char *result,char *arg1,char *op,char *ag2) 该函数功能是生成一个三地址语句送到四元式表中。 四元式表的结构如下: struct {char result[8]; char ag1[8]; char op[8]; char ag2[8]; }quad[20]; (2)char *newtemp() 该函数回送一个新的临时变量名,临时变量名产生的顺序为T1,T2,…. Char *newtemp(void) { char *p; char m[8]; p=(char *)malloc(8); k++; itoa(k,m,10); strcpy(p+1,m); p[0]=’t’; return(p); } (2)主程序示意图如图c.10所示。 (2) 函数lrparser在原来语法分析的基础上插入相应的语义动作:将输入串翻译成四元式序列。在实验中我们只对表达式、赋值语句进行翻译。 语义分析程序的C语言程序框架 int lrparser() { int schain=0; kk=0; if(syn=1) { 读下一个单词符号; schain=yucu; /调用语句串分析函数进行分析/ if(syn=6) { 读下一个单词符号; if(syn=0 && (kk==0)) 输出(“success”); } else { if(kk!=1 ) 输出 ‘缺end’ 错误;kk=1;} else{输出’begin’错误;kk=1;} } return(schain); int yucu() { int schain=0; schain=statement();/调用语句分析函数进行分析/ while(syn=26) {读下一个单词符号; schain=statement(); /调用语句分析函数进行分析/ } return(schain); } int statement() { char tt[8],eplace[8]; int schain=0; {switch(syn) {case 10: strcpy(tt,token); scanner(); if(syn=18) {读下一个单词符号; strcpy(eplace,expression()); emit(tt,eplace,””,””); schain=0; } else {输出’缺少赋值号’的错误;kk=1; } return(schain); break; } } char *expression(void) {char *tp,*ep2,*eplace,*tt; tp=(char *)malloc(12);/分配空间/ ep2=(char *)malloc(12); eplace=(char *)malloc(12); tt =(char )malloc(12); strcpy(eplace,term ());/调用term分析产生表达式计算的第一项eplace/ while(syn=13 or 14) { 操作符 tt= ‘+’或者‘—’; 读下一个单词符号; strcpy(ep2,term());/调用term分析产生表达式计算的第二项ep2/ strcpy(tp,newtemp());/调用newtemp产生临时变量tp存储计算结果/ emit(tp,eplace,tt,ep2);/生成四元式送入四元式表/ strcpy(eplace,tp); } return(eplace); } char *term(void)/仿照函数expression编写/ char *factor(void) {char *fplace; fplace=(char *)malloc(12); strcpy(fplace, “ ”); if(syn=10) {strcpy(fplace,,token);/将标识符token的值赋给fplace/ 读下一个单词符号; } else if(syn=11) {itoa(sum,fplace,10); 读下一个单词符号; } else if (syn=27) {读下一个单词符号; fplace=expression();/调用expression分析返回表达式的值/ if(syn=28) 读下一个单词符号; else{输出‘}’错误;kk=1; } } else{输出‘(’错误;kk=1; } return(fplace); }

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

JAVA开发区

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值