第二章
语言,文法,上下文无关法
串上的运算
xy = string x + string y
字符串A的正闭包 不含0次方幂
字符串A的闭包(又称克林闭包) 含0次方幂 0次方幂有个特殊的符号~
文法的类型 第一种上下文有关 (CSG context-sensitive grammer)
第二种上下文无关 (CSG context-free grammer)
更加规范的定义:四元组(Vn,Vt,P,S)
Vn:终结符集 实际的词 非大写字母
Vt:非终结符集 广阔的含义 大写字母
P:规则 句子的文法
S:开始符 句子
什么叫做完全推导树
所有的终端结点都是和终结符相关联
分析树 把符号分析成表达式的情况
二义性:由此可以引导出 左结合操作树,右结合操作树
推导:见书111页,从E到-(id)的推导99
第三章 词法分析器
词法分析器的任务:
读入源程序的输入序列 组合成词素(lexemes) 建立词法单元(token)
RE :regular expression 正则表达式
一个很有意思的东西
C语言中标识符的正则定义
digit--->0|2|...|9
letter_--->A|B|...|Z|a|b|...|z|_
id --->letter_(letter_|digit)*
单词的识别
有穷自动机 (三型)FA finite automata
DFA NFA 从NFA到DFA的转化
从RE到自动机
Lex的使用