深机笔记 - 18 Javac编译器

《深入理解Java虚拟机:JVM高级特性与最佳实践(第2版)》10.2节
下文提及的实现类全部是Javac源码中的实现类

编译过程可3个过程:
1) 解析与填充符号表
2) 插入式注解处理器的注解处理
3) 语义分析与字节码生成

Javac编译动作入口是com.sun.tools.javac.main.JavaCompiler类,上述3个过程代码逻辑集中在该类compile()和compile2()方法
上图中的回环称为Round,具体解释见下文

整个编译最关键的处理由下图标注的8个方法完成


过程1. 解析与填充符号表

1. 解析
包括词法、语法分析

1) 词法分析
将源代码的字符流转变为标记(Token)集合
单个字符是程序编写过程的最小元素,而标记是编译过程的最小元素
关键字、变量名、字面量、运算符都可以成为标记

2) 语法分析
根据Token序列构造抽象语法树
抽象语法树(Abstract Syntax Tree, AST)是一种用来描述程序代码语法结构的树形表示方式
抽象语法树的每个节点代表程序代码中的一个语法结构(Construct)
经过该步骤后,编译器就基本不会再对源码文件进行操作,后续操作都建立在抽象语法树上

抽象语法树例:


入口是parseFiles()
词法分析实现类是com.sun.tools.javac.parser.Scanner类
语法分析实现类是com.sun.tools.javac.parser.Parser类
出口由com.sun.tools.javac.tree.JCTree类表示

2. 填充符号表
符号表(Symbol Table)是由一组符号地址和符号信息构成的表格
可想象成哈希表K-V值对形式(实际可是有序符号表、树状符号表、栈结构符号表等)
符号表中登记的信息在编译的不同阶段都会用到
在语义分析阶段,符号表登记的内容用于语义检查(如检查名字的使用和原先的说明是否一致)和产生中间代码
在目标代码生成阶段,对符号名进行地址分配时,符号表是地址分配的依据

入口是enterTrees()
实现类是com.sun.tools.javac.comp.Enter类
出口是待处理列表(To Do List),包含了每一个编译单元的抽象语法树的顶级节点,及package-info.java(若存在)的顶级节点

过程2. 注解处理

插入式注解处理器可看做是一组编译器插件,在这些插件中,可读取、修改、添加抽象语法树中的任意元素
若这些插件在处理注解期间对语法树进行了修改,则编译器将回到解析及填充符号表过程重新处理,直到所有插件对语法树进行修改完为止
上述每一次循环称为一个Round,即本文第一张图中的回环

初始化过程入口是initPorcessAnnotations()
执行过程入口是processAnnotations(),该方法判断是否有新的注解处理器需要执行,若有的,则通过com.sun.tools.javac.processing.JavacProcessingEnvironment类doProcessing()方法生成新的JavaCompiler对象对编译的后续步骤进行处理

过程3. 语义分析与字节码生成

1. 语义分析
抽象语法树能表示一个结构正确的源程序的抽象,但无法保证源程序符合逻辑
语义分析的主要任务是,对结构上正确的源程序进行上下文有关性质的审查,如进行类型审查
语义分析分2步骤:标注检查、数据及控制流分析

1) 标注检查
检查内容包括,如变量使用前是否已被声明、变量与赋值之间数据类型是否匹配等
常量折叠,语法树上字面量“1”、“2”及操作符“+”,会被折叠为字面量“3”

入口是attribute()
实现类是com.sun.tools.javac.comp.Attr类和com.sun.tools.javac.comp.Check类

2) 数据及控制流分析
对程序上下文逻辑更进一步的验证
检查内容包括,如程序局部变量在使用前是否有赋值、方法每条路径是否都有返回值、是否所有受查异常都被正确处理等
编译期与类加载时的数据及控制流分析的目的基本一致,但校验范围有所区别,有一些校验项只有在编译期或运行期才能进行
局部变量声明为final,对运行期无影响,变量的不变性由编译器在编译期间保障

入口是flow()
实现类是com.sun.tools.javac.comp.Flow类

2. 解语法糖
Java中常用语法糖主要是泛型、变长参数、自动装箱/拆箱等
虚拟机运行时不支持语法糖语法,在编译阶段需还原回基础语法结构,该过程称解语法糖

入口时desugar()
实现类是com.sun.tools.javac.comp.TransTypes类和com.sun.tools.javac.comp.Lower类

3. 字节码生成
进行了少量的代码添加和转换工作
把生成的信息(语法树、符号表)转化成字节码写到磁盘
“写到磁盘”由com.sun.tools.javac.jvm.ClassWriter类的writeClass()输出字节码,生成最终Class文件

代码添加例:
实例构造器<init>()方法和类构造器<clinit>()方法是在该阶段添加到语法树中的
上述两个构造器的产生过程实际上是代码收敛的过程
编译器把语句块(实例构造器是“{}”块,类构造器是"static{}"块)、变量初始化(实例变量和类变量)、调用父类的实例构造器(<clinit>()无须调用父类<clinit>(),虚拟机自动保证父类构造器执行,但会生成调用java.lang.Object的<init>()的代码)等操作收敛到<init>()和<clinit>()中,且保证按先执行父类实例构造器,然后初始化变量,最后执行语句块的顺序进行
上述动作由Gen.normalizeDefs()方法实现
代码替换例:
把字符串的加操作替换为StringBuffer或StringBuilder的append()操作

入口generate()
实现类com.sun.tools.javac.jvm.Gen类

至此编译过程结束

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值