早期(编译期)优化

从计算机程序出现的第一天起,对效率的追求就是程序天生的坚定信仰,这个过程犹如一场没有终点,永不停歇的F1方程式竞赛,程序员试车手,技术平台则是在赛道上飞驰的赛车。

Java语言的“编译期”其实是一段“不确定”的操作过程,因为它可能是指一个前端编译器把*.java文件转为*.class文件的过程;也可能是指虚拟机的后端运行期编译器把字节码转换为机器码的过程;还可能是指使用静态提前编译器直接把*.java文件编译成本地机器码的过程。

Javac这类编译器对代码的运行效率几乎没有任何优化措施。虚拟机设计团队把对性能的优化集中到了后端的即时编译器中,这样可以让那些不是由Javac产生的Class文件(如JRuby,Groovy等语言的Class文件)也同样能享受到编译器优化所带来的好处。但是Javac做了许多针对Java语言编码过程的优化措施来改善程序员的编码风格和提高编码效率。相当多的新生的Java语法特性,都是靠编译器的“语法糖”来实现,而不是依赖虚拟机的底层改进来支持,可以说,Java中即时编译器在运行期的优化过程对于程序运行来说更重要,而前端编译器在编译期的优化过程对于程序编码来说关系更加密切。

Javac编译器

分析源码是了解一项技术的实现内幕最有效的手段,Javac编译器不像HotSpot虚拟机那样使用C++语言实现,它本身就是一个由Java语言编写的程序,这为纯Java的程序员了解它的编译过程带来了很大的便利。

虚拟机规范严格定义了Class文件的格式,但是并没有对如何把Java源码文件转变为Class文件的编译过程进行十分严格的定义,这导致Class文件编译在某种程度上是与具体JDK实现相关的,在一些极端情况下,可能出现一段代码Javac编译器可以编译,但是ECJ编译器就不可以编译的问题。从Sunday Javac的代码来看,编译过程大致可以分为3个过程,分别是:

  • 解析与填充符号表过程。
  • 插入式注解处理器的的注解处理过程。
  • 分析与字节码生成过程

Javac编译动作的入口式com.sun.tools.javac.main.JavaCompiler类,上述3个过程的代码逻辑集中在这个类的compile()和compile2()方法中。

解析与填充符号表

解析步骤包括了经典程序编译原理中的词法分析和语法分析两个过程。

1.语法,词法分析

词法分析是将源代码的字符流转变为标记集合,单个字符是程序编写过程的最小元素,而标记则是编译过程的最小元素,关键字,变量名,字面量,运算符都可以成为标记,如“int a=b+2”这句代码包含了6个标记,分别是int,a,=,b,+,2,虽然关键字int由3个字符构成,但是它只是一个Token,不可再拆分。在Javac的源码中,词法分析过程由com.sun.tools.javac.parser.Scanner类来实现。
语法分析是根据Token序列构造抽象语法树的过程,抽象语法树(AST)是一种用来描述程序代码语法结构的树形表示方式,语法树的每个节点都代表着程序代码中的一个语法结构,一如包,类型,修饰符,运算符,接口,返回值甚至代码注释等都可以是一个语法结构。

在Javac的源码中,语法分析过程由com.sun.tools.javac.parser.Parser类实现,这个阶段产出的抽象语法树由com.sun.tools.javac.tree.JCTree类表示,经过这个步骤之后,编译器就基本不会在对源码文件进行操作了,后续的操作都建立在抽象语法树之上。

2.填充符号表

完成了语法分析和词法分析之后,下一步就是填充符号表的过程,符号表是由一组符号地址和符号信息构成的表格,我们可以把它想象成哈希表中的K-V值对的形式(实际上符号表不一定是哈希表实现,可以是有序符号表,树状符号表,栈结构符号表等)。符号表中所有登记的信息在编译的不同阶段都要用到。在语义分析中,符号表所登记的内容将用于语义的检查(如检查一个名字的使用和原先的说明是否一致)和产生中间代码。在目标代码生成阶段,当对符号名进行地址分配时,符号表是地址分配的依据。

在javac源代码中,填充符号表的过程由com.sun.tools.javac.comp.Enter类实现,此过程的出口是一个待处理列表,包含了每一个编译单元的抽象语法树的顶级节点,以及package-info.java(如果存在的话)的顶级节点。

  1. 注解处理器

在JDK1.5之后,Java语言提供了对注解的支持,这些注解与普通的Java代码一样,是在运行期间发挥作用的。在JDK1.6中实现了JSR-269规范,提供了一组出入式注解处理器的标准API在编译期间对注解进行处理,我们可以把它看做是一组编译器的插件,在这些插件里面,可以读取,修改,添加抽象语法树中的任意元素。如果这些插件在处理注解期间对语法树进行了修改,编译器将回到解析及填充符号表的过程重新处理,知道所有插入式注解处理器都没有再对语法树进行修改为止,每一次循环称为一个Round。

有了编译器处理的标准API后,我们的代码才有可能干涉编译器的行为,由于语法数中的任意元素,甚至包括代码注解都可以在插件之中访问到,所以通过插入式注解处理器实现的插件在功能上有很大的发挥空间。只要有足够的创意,程序员可以使用插入式注解处理器来实现许多原本只能在编码中完成的事情。

在javac源码中,插入式注解处理器的初始化过程是在initPorcessAnnotations()方法中完成的,而他的执行过咸亨则是在processAnnotations()方法中完成的,这个方法判断是否还有新的注解处理器需要执行,如果有的话,通过com.sun.tools.javac.processing.JavacProcessingEnvironment类的我都Processing()方法生成一个新的JavaCompiler对象对变异的后续步骤进行处理。

语义分析与字节码生成

语法分析之后,编译器获得了程序代码的抽象树表示,语法树能表示一个结构正确的源程序的抽象,但无法保证源程序是否符合逻辑的,而语义分析的主要任务是对结构上正确的源程序进行上下文有关性质的审查,如进行类型审查。举个例子,假设有如下的3个变量定义语句:

int a = 1;
boolean b = false;
char c = 2;

后续可能出现的赋值运算:

int d = a + c;
int d = b + c;
char d = a + c;

后续代码中如果出现了如上3种赋值运算的话,那他们都能构成结构正确的语法树,但是只有第一种的写法在语义上没有问题,能通过编译,其余两种在Java语言中是不符合逻辑的,无法编译。

1.标注检查

Javac的编译过程中,语义分析过程分为标注检测以及数据及控制流分析两个步骤,分别由attribute()和flow()方法完成。

标注检测步骤检测的内容包括诸如变量使用前是否已被声明,变量与赋值之间的数据类型是否匹配等。在标注检测步骤中,还有一个重要的动作称为常量折叠,如果我们在代码中写了如下定义:
int a = 1 + 2;
那么在语法树上仍然能看到字面量“1”,“2”以及操作符“+”,但是在经过常量折叠之后,他们将会被折叠为字面量“3”。由于编译期间进行了常量折叠,所以在代码里面定义“a = 1 + 2”比起直接定义“a = 3”,并不会增加程序运行期哪怕仅仅一个CPU指令的运算量。

2.数据及控制流分析

数据及控制流分析是对程序上下文逻辑更进一步的验证,它可以检查出诸如程序局部变量在使用前是否赋值,方法的每条路径是否都有返回值,是否所有的受检查异常都被正确处理了等问题。编译时期的数据及控制流分析与类加载时的数据及控制流分析的目的基本上是一致的,但校验范围有所区别,有一些校验项只有在编译期或运行期才能进行。

3.解语法糖

语法糖,也称糖衣语法,是由英国计算机科学家彼得约翰兰达发明的一个术语,指在计算机语言中添加的某种语法,这种语法对语言的功能并没有影响,但是更方便程序员使用。通常来说,使用语法糖能够增加程序的可读性,从而减少程序代码出错的机会。

Java在现代编程语言之中属于“低糖语言”,尤其是JDK1.5之前的版本,“低糖”语法也是Java语言被怀疑已经“落后”的一个表面理由。Java种最常用的语法糖主要是泛型,边长参数,自动装箱/拆箱等,虚拟机运行时不支持这些语法,他们在编译阶段还原回简单的基础语法结构,这个过程称为解语法糖。

4.字节码生成

字节码生成是Javac编译过程的最后一个阶段,在Javac源码中由com.sun.tools.javac.jvm.Gen类来完成。字节码生成阶段不仅仅是把前面个步骤生成的信息转化成字节码写到磁盘中,编译器还进行了少量的代码添加和转换工作。

例如,前面提到的< init>()方法和构造器< cinit>()方法就是在这个阶段添加到语法树之中的,这两个构造器的产生过程实际上是一个代码收敛的过程,编译器会把语句块(对实例构造器而言是“{}”块,对于类构造器而言是“static{}”块),变量初始化(实例变量和类变量),调用父类的实例构造器(仅仅是实例构造器,< cinit>()方法中无需调用父类的< init>()方法,虚拟机会自动保证父类构造器的执行,但在< init>()方法中经常会成调用java.lang.Object的< init>()方法的代码)等操作收敛用到< init>()和< cinit>()方法之中,并且保证一定是按照先执行父类的实例构造器,然后初始化变量,最后执行语句块的顺序进行。

完成了对语法树的遍历和调整之后,就会把填充了所需信息的符号表交给com.sun.tools.javac.jvm.ClassWriter类,有这个类的writeClass()方法输出字节码,生成最终的Class文件,到此整个编译过程宣告结束。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值