Java语言的“编译期”是一段“不确定”的操作过程,因为它可能指:
- 前端编译器(编译器的“前端”)把*.java文件转变成*.class文件的过程: Javac
- 后端运行期编译器(JIT)把字节码转变成机器码的过程:HotSpot VM的C1、C2
- 静态提前编译器(AOT)直接把*.java文件编译成本地机器码的过程
本章讨论的“编译期”和“编译器”都仅限于第一类编译过程。
Javac对代码的运行效率几乎没有任何优化措施,但做了许多针对Java语言编码过程的优化措施来改善程序员的编码风格和提高编码效率。相当多新生的Java语法特性,都是靠编译器的“语法糖”来实现。
Javac编译器
Javac编译过程大致可以分为3个过程:
- 解析和填充符号表过程
- 插入式注解处理器的注解处理过程
- 分析与字节码生成过程
解析和填充符号表
- 词法、语法分析
- 词法分析将源代码的字符流转变为标记(Token)集合
- 语法分析根据Token序列构造抽象语法树
- 填充符号表
- 符号表是由一组符号地址和符号信息构成的表格
注解处理器
注解在运行期间发生作用。
如果注解处理器在处理注解期间对语法树进行了修改,编译器将回到解析及填充符号表的过程重新处理,直到所有插入式注解处理器都没有再对语法树进行修改为止,每一次循环称为一个Round(上图10-4的循环过程)。
语义分析与字节码生成
语法分析后,编译器获得了程序代码的抽象语法树表示,语法树能表示一个结构正确的源程序的抽象,但无法保证源程序是符合逻辑的。而语义分析的主要任务是对结构上正确的源程序进行上下文有关性质的审查,如进行类型审查。
- 标注检查
- 检查变量使用前是否已被声明、变量与赋值之间的数据类型能否匹配等
- 数据及控制流分析
- 能检查出诸如程序局部变量在使用前是否有赋值、方法的每条路径是否都有返回值、是否所有的受查异常都被处理了等问题
- 将局部变量声明为final,对运行期没有影响,变量的不变性仅仅由编译器在编译期间保障。
- 解语法糖
- 使用语法糖能增加程序的可读性,从而减少程序代码出错的机会
- 字节码生成
- 把前面各个步骤所生成的信息转化成字节码写到磁盘中,进行少量的代码添加和转换工作
Java语法糖的味道
泛型与类型擦除
Java中的泛型只在程序源码中存在,在编译后的字节码文件中,会替换成原来的原生类型,并在相应的地方插入强制转型代码。ArrayList和ArrayList对Java来说就是同一个类。Java中泛型实现方法称为类型擦除,基于这种方法实现的泛型称为伪泛型。
引入Signature、LocalVariableTypeTable等属性用于解决伴随泛型而来的参数类型的识别问题。擦除法所谓的擦除,只是对方法的Code属性中的字节码进行擦除,元数据中还是保留了泛型信息。
自动装箱、拆箱与遍历循环
遍历循环会把代码还原成迭代器的实现,这就是遍历的类需要实现Iterable接口的原因。
这是关于Java中自动装箱与拆箱的一段代码:
public class BoxingTest {
public static void main(String[] args) {
Integer a = 1;
Integer b = 2;
Integer c = 3;
Integer d = 3;
Integer e = 321;
Integer f = 321;
Long g = 3L;
System.out.println(c == d); //true
System.out.println(e == f); //false
System.out.println(c == (a + b)); //true
System.out.println(c.equals(a + b)); //true
System.out.println(g == (a + b)); //true
System.out.println(g.equals(a + b)); //false
}
}
装箱代码,注意IntegerCache的存在:
public static Integer valueOf(int i) {
if (i >= IntegerCache.low && i <= IntegerCache.high)
return IntegerCache.cache[i + (-IntegerCache.low)];
return new Integer(i);
}
拆箱代码:
public int intValue() {
return value;
}
编译完的class文件,再重新反编译后的代码:
public class BoxingTest{
public static void main(String[] args){
Integer a = Integer.valueOf(1);
Integer b = Integer.valueOf(2);
Integer c = Integer.valueOf(3);
Integer d = Integer.valueOf(3);
Integer e = Integer.valueOf(321);
Integer f = Integer.valueOf(321);
Long g = Long.valueOf(3L);
System.out.println(c == d);
System.out.println(e == f);
System.out.println(c.intValue() == a.intValue() + b.intValue());
System.out.println(c.equals(Integer.valueOf(a.intValue() + b.intValue())));
System.out.println(g.longValue() == a.intValue() + b.intValue());
System.out.println(g.equals(Integer.valueOf(a.intValue() + b.intValue())));
}
}
- System.out.println(c == d) => System.out.println(c == d):类型一致,不涉及装箱与拆箱,变量c、d保存于线程私有栈中,c和d是保存的是一个地址引用,指向内存堆中的某个地址,对于值在【-128,127】Integer类型,由于IntegerCache.cache[]的存在,所以c、d指向的是堆中同一个地址,故执行结果为true
- System.out.println(e == f) => System.out.println(e == f): 类型一致,不涉及装箱与拆箱操作,判定规则参照上面的分析,因为321不在【-128,127】内,故e和f指向的是内存堆中两个不同的地址,故执行结果为false
- System.out.println(c == (a + b)) => System.out.println(c.intValue() == a.intValue() + b.intValue()):通过反编译字节码我们可以看到,这里涉及了包装类型的拆箱操作,只有基础类型才可以进行加法操作,实际比较的是存于Java私有线程栈中两个int类型的数值比较,执行结果为true
- System.out.println(c.equals(a + b)) => System.out.println(c.equals(Integer.valueOf(a.intValue() + b.intValue()))):这里涉及了先拆箱,然后再装箱的操作,a+b先执行拆箱操作,然后再对结果执行装箱操作,最后执行equals方法,我们看下Integer类中equals方法的定义如下,很明显,执行结果为true
public boolean equals(Object obj) {
if (obj instanceof Integer) {
return value == ((Integer)obj).intValue();
}
return false;
}
- System.out.println(g == (a + b)) => System.out.println(g.longValue() == a.intValue() + b.intValue()):类型不一致,拆箱操作,g和a、b分别执行了拆箱操作,然后比较结果,执行结果为true
- System.out.println(g.equals(a + b)) => System.out.println(g.equals(Integer.valueOf(a.intValue() + b.intValue()))):与第四条规则一致,先拆箱执行加法操作,然后加法结果执行装箱操作,最后执行Long类型的equals方法,Long中equals方法定义如下,故执行结果为false
public boolean equals(Object obj) {
if (obj instanceof Long) {
return value == ((Long)obj).longValue();
}
return false;
}
集合中只能包含对象,不能包含基础数据类型,如果将基础数据类型的数据添加到集合操作,JVM(JDK1.5之后)会自动进行装箱操作,将基础数据类型封装为对应的封装类
条件编译
使用条件为常量的if语句