第二章 词法分析器
这一章好多看不懂的 后面×号标注 等回头再来看
识别单词
- FA 有限自动机,即对于各种情况的所有集合
正则表达式
对于任意FA,可以使用一种称为正则表达式(Regular Expression)的符号表示法来描述其语言。通过RE描述的语言称为正则语言。 RE等效于FA
-
RE符号
- 连接:明确写出的字符意味着对应语言中的单词也需要按照该顺序依次出现 new
- 选择:或(or)用|表示, new or while ==> new|while ; new or not ==> n(ew|ot)
- 标点符合和关键词 直接写 : ; ? => ( ) { } [ ] if while this integer
- 零次或多次出现 用* 表示: x* 即x可以出现零次或者多次
运算符称作柯林闭包(Kleene closure) ,
例 :一个合法无符号整数RE: 0|(1|2|3|4|5|6|7|8|9)(0|1|2|3|4|5|6|7|8|9) // 非0开头 向后无限循环 - 有限闭包 对一整数i Ri(i为上角标)指定了R出现一次到i次的情形
正闭包 R+ 出现1次或者多次 - 括号具有最高优先级,顺次为闭包、连接和选择
- 求补运算符^ 例 字符串可以描述为 “(^”)*" // 即两个引号中不是"的任意多个字符
优先级高于 * | + - 转义序列 \n
- 注释的写法
-
RE的闭包性质