编译原理预习报告——陈述实现词法分析器的基本原理

一、实验目的

从实验功能以及学生能力培养方面陈述实验目的。

、实验原理

     陈述实现词法分析器的基本原理。

、实验要求

1. 单词分类

明确所分析的代码片段包含的单词种别,以及有限单词的具体内容。比如保留字集合、运算符集合等。

2. 待分析的源程序的输入形式和识别后单词的输出形式

明确输入以文件输入,输出二元组中单词种别码的表述形式。

3. 单词状态转换图

给出各类单词识别的状态转换图。

4. 算法设计

定义实现词法分析程序的每个函数的首部,说明函数的主要功能。

实验预习报告

实验题目:  词法分析器的设计

一、实验目的

1. 对一个简单的C语言的程序设计并实现一个简单的词法分析器;

2. 掌握利用状态转换图设计词法分析器的基本方法;

3. 利用该词法分析器完成对一个源程序字符串的词法分析;

4. 对于该词法分析器的设计,保证其输出形式是源程序的单词符号是二元式的代码,并可以通过输出界面准确地显示出来;

5. 培养学生自己创建一个词法分析器的思维能力,在设计一个词法分析器时,需要准确地明确各个单词符号和单词中别码。

、实验原理

    1. 词法分析器的主要任务是首先输入源程序,然后扫描源程序,分解各个字符串,识别出所定义的各个单词符号,单词符号主要包括关键字、标识符、运算符、界限符和常数;

2. 词法分析器的实现可以分为两个阶段,第一个阶段是扫描阶段,主要是从左至右扫描输入源程序,删除注释、压缩空白字符。第二个阶段是词法分析阶段,主要是按照语言的词法规则识别各类单词,并产生相应的单词符号。

、实验要求

1. 单词分类

明确所分析的代码片段包含的单词种别,以及有限单词的具体内容。将具体的单词符号与对应的种别码一一对应如下:

其中erro代表错误的单词符号,#代表结束的单词符号,关键词由具体种别码代表,其中本词法分析器所设计的关键字有begin、if、then、while、end和int六种,标识符为一类种别码代表,整数常数由一类种别码代表,其余的运算符和界符也都是单词符号与单词种别码一一对应。

单词符号

单词种别码

单词符号

单词种别码

erro

-1

/

12

#

0

<

13

begin

1

<>

14

if

2

<=

15

then

3

>

16

while

4

>=

17

end

5

=

18

int

6

;

19

标识符

7

(

20

常数(整数)

8

)

21

+

9

{

22

-

10

}

23

*

11

2. 待分析的源程序的输入形式和识别后单词的输出形式

明确输入以文件输入,输出二元组中单词种别码的表述形式。

3. 单词状态转换图

  1. 识别关键字和标识符的状态转换图

        2. 识别整常数的状态转换图

        3. 识别运算符和界限符的状态转换图

4. 算法设计

定义实现词法分析程序的每个函数的首部,说明函数的主要功能。

  1. 实现词法分析器的主函数

  1. 对于关键字和标识符的识别处理

  1. 对于整常数的识别处理

  1. 对于运算符的识别处理

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
词法分析 一、实验目的: 通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。 编制一个读单词过程,从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符、分隔符五大类。并依次输出各个单词的内部编码及单词符号自身值。(遇到错误时可显示“Error”,然后跳过错误部分继续显示) 二、实验说明 1、 词法分析器的功能和输出格式 词法分析器的功能是输入源程序,输出单词符号。词法分析器的单词符号常常表示成以下的二元式(单词种别码,单词符号的属性值)。本实验中,采用的是一类符号一种别码的方式。 2、 单词的BNF表示 -> ->|| |ε -> -> |ε -> + -> - -> > -> >= 三、实验要求 (一)准备: 1.阅读课本有关章节,明确语言的语法,写出基本保留字、标识符、常数、运算符、分隔符和程序例。 2.初步编制好程序。 3.准备好多组测试数据。 (二)上课上机: 将源代码拷贝到机上调试,发现错误,再修改完善。 第二次上机调试通过。 (三)程序要求: 程序输入/输出示例: 如源程序为C语言。输入如下一段: main() { int a,b; a = 10; b = a + 20; } 要求输出如下: (2,”main”) (5,”(“) (5,”)“) (5,”{“) (1,”int”) (2,”a”) (5,”,”) (2,”b”) (5,”;”) (2,”a”) (4,”=”) (3,”10”) (5,”;”) (2,”b”) (4,”=”) (2,”a”) (4,”+”) (3,”20”) (5,”;”) (5,”}“) 要求: 识别保留字:if、int、for、while、do、return、break、continue; 单词种别码为1。 其他的都识别为标识符;单词种别码为2。 常数为无符号整形数;单词种别码为3。 运算符包括:+、-、*、/、=、>、=、<=、!= ; 单词种别码为4。 分隔符包括:,、;、{、}、(、); 单词种别码为5。 以上为参考,具体可自行增删。 (四)程序思路 这里以开始定义的C语言子集的源程序作为词法分析程序的输入数据。在词法分析中,自文件头开始扫描源程序字符,一旦发现符合“单词”定义的源程序字符串时,将它翻译成固定长度的单词内部表示,并查填适当的信息表。经过词法分析后,源程序字符串(源程序的外部表示)被翻译成具有等长信息的单词串(源程序的内部表示),并产生两个表格:常数表和标识符表,它们分别包含了源程序中的所有常数和所有标识符。 0.定义部分:定义常量、变量、数据结构。 1.初始化:从文件将源程序全部输入到字符缓冲区中。 2.取单词前:去掉多余空白。 3.取单词后:去掉多余空白(可选,看着办)。 4.取单词:利用实验一的成果读出单词的每一个字符,组成单词,分析类型。(关键是如何判断取单词结束?取到的单词是什么类型的单词?)
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值