词法分析与有穷自动机
1、词法分析程序的功能
词法分析程序(词法分析器、扫描器):执行词法分析的程序,以字符串形式的源程序作为输入,以单词符号或单词符号表示的源程序作为输出。
语言的单词符号一般可分为五种:关键字、标识符、常数、运算符和界符。
词法分析的输出形式:(单词种别,单词自身的值)
2、正规集、正规式、正规文法、确定的有穷自动机、不确定的有穷自动机的定义。
语言单词符号的两种定义方式:正规式+正规文法。
正规式:设有字母表∑={a1,a2,a3,a4…an},在该字母表上的正规式D和所表示的正规集L有以下关系。
正规式D包含三种运算符:连接"."、或“|”、闭包“*”,优先级递增。连接一般忽略不写。
L(e1 | e2) = L(e1) ∪L(e2).
L(e1e2) = L(e1)L(e2)
L((e1)*) = L( (e1)*)
正规式等价:正规式R1和R2描述的正规集相同。
正规文法和正规式的转换:
正规文法 => 正规式:
- 把每个非终结符按照规则表示成一