编译原理01
编译过程
狭义的编译大致可分为下面4个阶段
1 语法分析(广义的语法分析)
首先要对代码进行解析,将其转换为计算机易于理解的形式,获得语法树
1.1 词法分析
将代码分割为一个个的单词,也可以成为扫描(scan),并且在该过程中,会将空白符和注释这种对程序没有实际意义的部分剔除。
正因为预先有了词法分析,语法分析器才可以只处理有意义的单词,进而实现简化处理
词法分析的工作不仅仅是将代码分割成单词,在分割的同时还会推算出单词的种类,并为单词添加语义值,如“这个单词的语义是数值53”。
1.2 语法分析(狭义的语法分析)
语法分析的结果是生成token序列token由“一个单词(的字面)”和“它的种类”“语义值”组成)
一般编程语言的语法单位有下面这些。
- 定义(definition),指变量定义,函数定义或类定义等。
- 声明(declaration),上面说的变量定义,准确地说是声明
- 语句(statement),值函数或方法的定义的方法体
- 表达式(expression),是比语句小、具有值的语法单位。
项(term),x+y是表达式,而x是其中一项
定义包含语句,语句包含表达式,表达式包含项。请记住这样的层次结构2 语义分析 通过解析代码获得语法树后,接着就要解析语法树,除去多余内容,添加必要的信息,生成抽象语法树 主要任务是对结构上正确的源程序进行上下文有关信息的审查,如进行类型审查。 注意,编译语言的编译器中解析器的主要作用是解析由扫描器生成的token序列,并生成代码对应的树形结构,即语法树,确切地说,也有方法可以不需要生成语法树,直接生成抽象语法树,但这样的方法仅限于及小型的编译器。 3 生成中间代码 解析代码转化为中间代码为止的这部分内容,称为编译器的前端(front-end) 4 代码生成
编程语言的运行方式
编译器会对程序进行编译,将其转换为可执行的形式。另外也有不进行编译,直接运行编程的方式。解释器,不讲程序转换为别的语言,而是直接运行
一般来说,有静态类型检查(static type checking)、要求较高可靠性的情况下使用编译的方式;相反,没有静态类型检查、对灵活性要求高于严密性的情况下,则使用解释的方式
Java中的前端编译器
这里指的是Hotspot虚拟机,指javac编译器,用于生成中间代码,即class字节码
编译过程大致可以分为三个过程,分别是:
解析和填充符号表,解析步骤包括了经典程序编译原理中的语义分析和语法分析
插入式注解处理器的注解处理过程
在JDK1.6中实现了JSR-269规范,提供了一组插入式注解处理器的标准API在编译期间对注解进行处理,如果在处理注解期间对语法树进行了修改,那么编译器将回到解析及填充符号表的过程重新处理- 分析与字节码生成过程
Java的后端编译器和运行方式
HotSpot采用解释器与即时编译器并存的架构:
- 解释器,当程序需要迅速启动和执行的时候,解释器首先发挥作用,省去编译的时间,立即执行
- 即时编译器,当程序运行时,随着时间的推移,即时编译器逐渐发挥作用,吧越来越多的代码编译成本地代码,获取更高的执行效率。