编译原理——词法分析(1)

词法分析


对词法分析器的要求

词法分析器的功能和输出形式

功能:

输入源程序,输出单词符号

单词符号:

关键字:保留字,基本字(全体视为一种或一字一种)
标识符:变量名,数组名(统归为一种)
常数: 整形,实型(按类型分种(整,实,布尔…))
运算符:+,-,*,/,…(一符一种或具有一定共性的运算符视为一种)
界符:;,,,(,),…(一符一种)

输出:

二元式形式(单词种别,单词符号的属性值)

这里写图片描述

词法分析器的设计

一、输入,预处理
输入串放入输入缓冲区
预处理:可剔掉一些无用符号:空白符,跳格符,回车符,换行符等

二、单词符号的识别:超前搜索
标识符:以字母开头的“字母|数字”串。

三、状态转换图
有限方向图,结点表示状态,状态间用箭弧连接,箭弧上的标记(符号)代表射出结点状态下有可能出现的输入字符或字符类。
一个状态转换图可用于识别(或接受)一定字符串。

这里写图片描述

正规表达式与有限自动机

正规式与正规集

定义:
这里写图片描述

这里写图片描述

例:Σ={a,b}

①a为首的任意符号串集合
正规式:a(a|b)*
②a为尾的任意符号串集合
正规式: (a|b)*a
③每个a至少有一个b紧跟其后的符号串集合
正规式为:b*(abb*)* 或b*(ab+)*

两正规式表示的正规集相同,则二者等价。

2.性质

①U|V=V|U
②U|(V|W)=(U|V)|W
③U(VW)=(UV)W
④U(V|W)=UV|UW (V|W)U=VU|WU
⑤εU=Uε=U

DFA(确定有限自动机)

这里写图片描述

这里写图片描述

DFA M含有m个状态,n个输入字符,则状态转换图有m个结点,每个结点至多有n条箭弧射出,每条箭弧用Σ中一个不同的输入字符做标记
这里写图片描述

  • 对∑*中任意字α,若存在从初态到某一终态的通路,且通路上所有弧标记符连接成的字等于α,则称α可为DFA所识别(读出或接受)。
  • 若M的初态结点同时也是终态结点,则空字ε可为M所识别。
  • DFA M所能识别的字的全体记为L(M)。
    这里写图片描述

NFA(不确定有限自动机)

定义:

这里写图片描述

DFA和NFA区别
  • DFA初态唯一,NFA不一定
  • DFA后继唯一,NAF不一定
FA的等价
  • 已知两FA,M1,M2 若L(M1)=L(M2),则称M1等价于M2。
  • 任意NFA,存在DFA,使L(DFA)=L(NFA)。

NFA确定化(NFA→DFA)——子集法

相关运算

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这个里面的都是测试数据,总共得分5分。从控制台输入,不能从文件中读取。实现了基本功能,加分项目都没有去实现,没有函数数组这些的实现。这是用C++语言写的,新建parser类别要选C++,其他对于VS的配置和C语言一样。for语句用的是枚举所有情况,你可以自行修改。 对预备工作中自然语言描述的简化C编译器的语言特性的语法,设计上下文无关文法进行描述 借助Yacc工具实现语法分析器 考虑语法树的构造: 1.语法树数据结构的设计:节点类型的设定,不同类型节点应保存哪些信息,多叉树的实现方式 2.实现辅助函数,完成节点创建、树创建等功能 3.利用辅助函数,修改上下文无关文法,设计翻译模式 4.修改Yacc程序,实现能构造语法树的分析器 考虑符号表处理的扩充 1.完成语法分析后,符号表项应增加哪些标识符的属性,保存语法分析的结果 2.如何扩充符号表数据结构,Yacc程序如何与Lex程序交互,正确填写符号表项 以一个简单的C源程序验证你的语法分析器,可以文本方式输出语法树结构,以节点编号输出父子关系,来验证分析器的正确性,如下例: main() { int a, b; if (a == 0) a = b + 1; } 可能的输出为: 0 : Type Specifier, integer, Children: 1 : ID Declaration, symbol: a Children: 2 : ID Declaration, symbol: b Children: 3 : Var Declaration, Children: 0 1 2 4 : ID Declaration, symbol: a Children: 5 : Const Declaration, value:0, Children: 6 : Expr, op: ==, Children: 4 5 7 : ID Declaration, symbol: a Children: 8 : ID Declaration, symbol: b Children: 9 : Const Declaration, value:1, Children: 10: Expr, op: +, Children: 8 9 11: Expr, op: =, Children: 7 10 12: if statement, Children: 6 11 13: compound statement, Children: 3 12
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值