使用Flex进行词法分析：Lex深入指南-CSDN博客

本文是关于Lex——一个词法分析器自动生成工具的详细指南。介绍了Lex的基本原理，包括如何在Cygwin环境下编译连接Lex源程序。内容涵盖Lex的工作流程、源程序编写规范、状态定义、词法规则、变量和函数，以及在Cygwin下编译 Lex程序的步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Lex使用指南

Lex是由美国Bell实验室M.Lesk等人用C语言开发的一种词法分析器自动生成工具，它提供一种供开发者编写词法规则（正规式等）的语言（Lex语言）以及这种语言的翻译器（这种翻译器将Lex语言编写的规则翻译成为C语言程序）。

Lex是linux下的工具，本实验使用的编译工具是cygwin（cygwin在windows下模拟一个linux环境）下的flex，它与lex的使用方法基本相同，只有很少的差别。

一、Lex的基本原理和使用方法

Lex的基本工作原理为：由正规式生成NFA，将NFA变换成DFA，DFA经化简后，模拟生成词法分析器。
其中正规式由开发者使用Lex语言编写，其余部分由Lex翻译器完成.翻译器将Lex源程序翻译成一个名为lex.yy.c的C语言源文件，此文件含有两部分内容：一部分是根据正规式所构造的DFA状态转移表，另一部分是用来驱动该表的总控程序yylex()。当主程序需要从输入字符流中识别一个记号时，只需要调用一次yylex()就可以了。为了使用Lex所生成的词法分析器，我们需要将lex.yy.c程序用C编译器进行编译，并将相关支持库函数连入目标代码。Lex的使用步骤可如下图所示：

二、lex源程序的写法：

Lex源程序必须按照Lex语言的规范来写，其核心是一组词法规则（正规式）。一般而言，一个Lex源程序分为三部分，三部分之间以符号%%分隔。

[第一部分：定义段]
%%
第二部分：词法规则段
[%%
第三部分：辅助函数段]

其中，第一部分及第三部分和第三部分之上的%%都可以省略（即上述方括号括起的部分可以省略）。以%开头的符号和关键字，或者是词法规则段的各个规则一般顶着行首来写，前面没有空格。
Lex源程序中可以有注释，注释由/和/括起，但是请注意，注释的行首需要有前导空白。
1. 第一部分定义段的写法：
定义段可以分为两部分：
第一部分以符号%{和%}包裹，里面为以C语法写的一些定义和声明：例如，文件包含，宏定义，常数定义，全局变量及外部变量定义，函数声明等。这一部分被Lex翻译器处理后会全部拷贝到文件lex.yy.c中。注意，特殊括号%{和%}都必须顶着行首写。例如：