编译原理作业
题目
Take one regular expression(identifier,etc) as example, and use flex to have a lexical analysis. 这里我选择一个正则表达式子,用flex这个软件来制作词法分析器。
下载flex
我用的是deepin系统(linux系统),下载flex也就非常方便了,直接敲指令下载
sudo apt-get install flex
了解flex
Flex是一个生成扫描器的工具,能够识别文本中的词法模式。Flex
读入给定的输入文件,如果没有给定文件名的话,则从标准输入读取,从而获得一个关于需要生成的扫描器的描述。此描述叫做规则,由正则表达式和C代码对组成。Flex 的输出是一个 C 代码文件——lex.yy.c——其中定义了yylex() 函数。编译输出文件可以生成一个可执行文件。当运行可执行文件的时候,它分析输入文件,为每一个正则表达式寻找匹配。当发现一个匹配时,它执行与此正则表达式相关的C代码。Flex不是GNU工程,但是GNU为Flex 写了手册。
Input and Out File
flex ′ ' ′ s actions are specified by definitions (which may include embedded C code) in one or more input files. The primary output file is `lex.yy.c’. You can also use some of the command-line options to get diagnostic output.
这里说的是默认的输出的文件就是lex.yy.c,有点像cpp文件,编译时候自动生成a.exe文件,可以加附加指令来改变名字
Format of the Input File
The flex input file consists of three sections, separated by a line with just `%%’ in it:
(LEX的输入是用LEX源语言编写的程序,它是扩展名为.l或.lex的文件。LEX源程序经过LEX系统处理后输出一个C程序文件,此文件再经过C编译器的编译就能产生一个可执行程序。一般而言,一个LEX源程序由“%%”分隔的三部分组成)
definitions 定义部分
%%
rules 识别规则部分
%%
user code 主函数部分
- 定义区包含一些简单的名字定义(name definitions)来简化词法扫描器(scanner)的规则,并且还有起始条件(start condition)的定义。
- 规则区包含了一系列具有pattern-action形式的规则,并且模式 pattern 位于行首不能缩进,action 也应该起始于同一行。
- 用户代码区的代码将被原封不动地拷贝到输出文件中,并且这些代码通常会被扫描器调用,当然,该区是可选的,如果 Flex 源文件中不存在该区,那么可以省略第二个 “%%” 。