高级程序设计语言
一、语言概述
1.1 语法 v.s. 语义
- 程序本质上是一定字符集上的字符串
- 语法:一组规则,用它可以形成和产生一个合式(well-formed)的程序
- 定义了程序的形式结构
- 定义语法单位的意义属于语义问题
- 语义:一组规则,定义一个程序的意义
- 例如 “关于函数调用时参数传递方法的描述” 属于语义定义
1.2 作用域
- 同一个标识符在不同过程中代表不同的名字
- 作用域:一个名字能被使用的区域范围
- 规则:“最近嵌套原则”
1.3 标识符 v.s. 名字
标识符是语法概念,名字是语义概念。
「标识符」
- 以字母开头的,由字母数字组成的字符串
「名字」
- 含义:标识程序中的对象
- 意义和属性:
- 值:单元中的内容
- 属性:类型和作用域
- 说明方式
- 说明语句明确规定
- int score
- 说明语句明确规定
-
- 隐含说明
- FORTRAN 以 I,J,K,...,N 为首的名字代表整型,否则为实型
- 隐含说明
-
- 动态确定
- 走到哪里,是什么,算什么
- 动态确定
- 名字的绑定
- 名字的绑定是指将标识符与所代表的程序数据或代码进行关联
- 静态绑定:发生在编译过程中,如变量声明、类型定义、函数定义
- 动态绑定:发生在运行过程中,如多态、虚函数
「二者区别」
- 标识符是语法概念
- 名字有确切的意义和属性
1.4 左值与右值
赋值语句:A := B
- 名字的左值:该名字代表的存储单元的地址
- 名字的右值:该名字代表的存储单元的内容
「简单判断」
- 出现在赋值号左边的值必须具有左值,出现在赋值号右边的值则必须具有右值。
二、语法描述
2.1 基本概念
- **字母表:**一个有穷字符集,记为
- **字符:**字母表中每个元素
- 字 / 字符串:
上的字(也叫字符串)是指由中的字符所构成的一个有穷序列
- **空字:**不包含任何字符的序列,记做
- 空字是字符串,不是字符
- 字的全体:
表示上的所有字的全体,包含空字
- 子集连接(积):
-
的子集 U 和 V 的连接(积)定义为
-
- n次积
- V自身的n次积记为
-
-
是 V 的闭包:
-
是 V 的正规闭包:
- 「区别」
-
中始终有空字,但如果V中原来没有空字,则中不会有空字
-
- V自身的n次积记为
2.2 上下文无关文法
「上下文无关文法 G 的定义 - 四元组」
-
终结符(Terminal)集合,非空
-
非终结符(Noterminal)集合,非空,且
-
文法的开始符号,
- S是特殊非终结符,表示所定义的语言最终感兴趣的语法单位,如英语描述中的“句子”,程序语言描述的“程序”
-
产生式集合(有限),每个产生式形式如下
-
-
表示 “P定义为”
-
- 开始符
至少必须在某个产生式的左部出现一次
2.3 推导
2.3.1 基本概念
-
:直接推出,只能对一个非终结符推导一次
-
:被定义为
「*推出 & +推出」
「概念辨析 - 句型 | 句子 | 语言」
「句型、句子推导练习」
- 文法 => 句子
- 句子 => 文法
- 此类题目稍微难一些,需要用递归思想来解决,优先考虑最简结构
2.3.2 语法树
「最左/右推导」
「语法树」
2.3.3 二义性
「二义性举例」
「文法 / 语言二义性」
- 文法二义性:文法存在某个句子对应两颗不同语法树
- 文法二义性问题是不可判定问题,不存在一个算法,能在有限步骤中,确切地判定一个文法是否二义
- 但仍然存在很多充分条件可以判定一个文法是非二义的
- 例如一个文法如果属于 LR 文法,则一定不是二义文法
- 语言二义性:存在一个能推导出该语言的无二义文法
2.4 形式语言
2.4.1 概述
- 乔姆斯基在1956年建立形式语言体系,将文法分为四种类型:0、1、2、3型
- 四种类型唯一区别在于产生式
- 0型(短语文法,图灵机)
- 1型(上下文有关文法,线性界限自动机)
- 2型(上下文无关文法,非确定下推自动机)
- 3型(正规文法,有限自动机)
-
- 正规式、正规集
2.4.2 文法对比
- 四种类型文法描述能力比较
- 上下文无关文法 v.s. 正规文法
- 上下文无关文法 v.s. 上下文有关文法
- 上下文无关文法的局限 - 权衡思想