Java 程序编译与代码优化之编译优化技术

最新推荐文章于 2022-11-14 19:18:44 发布

nisen6477

最新推荐文章于 2022-11-14 19:18:44 发布

阅读量457

点赞数

分类专栏： Java虚拟机

本文链接：https://blog.csdn.net/nisen6477/article/details/100517811

版权

Java虚拟机专栏收录该内容

14 篇文章 0 订阅

订阅专栏

文章目录

编译优化技术

编译优化技术

以一段代码来说明编译器是怎么优化代码的：
优化前的原始代码：

static class B {
	int value;
	final int get() {
		return value;
	}
}

public void foo() {
	y = b.get();
	// ...do stuff...
	z = b.get();
	sun = y + z;
}

第一步进行方法内联（Method Inlining），方法内联的重要性要高于其它优化措施，它的主要目的有两个，一是去除方法的调用成本（如建立栈帧等），二是为其他优化建立良好的基础，方法内联膨胀之后可以便于在更大范围上采取后续的优化手段，从而获得更好的优化效果。因此，各种编译器一般都会把内联优化放在优化序列的最靠前位置。内敛后的代码如下：

public void foo() {
	y = b.value;
	// ...do stuff...
	z = b.value;
	sun = y + z;
}

第二步进行冗余访问消除（Redundant Loads Elimination），假设代码中间注释掉的“do stuff…” 所代表的操作不会改变 b.value 的值，那就可以把 “z=b.value” 替换为 “z=y”，因为上一句 “y=b.value” 已经保证了变量 y 与 b.value 是一致的，这样就可以不再去访问对象 b 的局部变量了，如果把 b.value 看作是一个表达式，那也可以把这项优化看成是公共子表达式消除，优化后的代码如下：

public void foo() {
	y = b.value;
	// ...do stuff...
	z = y;
	sun = y + z;
}

第三步进行复写传播（Copy Propagation），因为在这段程序的逻辑中并没有必要时用一个额外的变量 “z”，它与变量 “y” 是完全相等的，因此可以使用 “y” 来代替 “z”。复写传播之后的代码如下：

public void foo() {
	y = b.value;
	// ...do stuff...
	y = y;
	sun = y + y;
}

第四步进行无用代码扫除（Dead Code Elimination）。无用代码可能是永远不会执行的代码，也可能是完全没有意义的代码，在上述代码中，“y=y” 是没有意义的，把他消除之后的代码如下：

public void foo() {
	y = b.value;
	// ...do stuff...
	sun = y + y;
}

经过四次优化之后，代码省略了许多语句，执行效率也会变得更高。
下面我们了解一下几项最具有代表性的优化技术是如何运作的，他们分别是：

语言无关的经典优化技术之一：公共子表达式消除
语言相关的经典优化技术之一：数组范围检查消除
最重要的优化技术之一：方法内联
最前沿的优化技术之一：逃逸分析

公共子表达式消除

公共子表达式消除是一个普遍应用于各种编译器的经典优化技术，它的含义是：如果一个表达式 E 已经计算过了，并且从先前的计算到现在 E 中所有变量的值都没有发生变化，那么 E 的这次出现就成为了公共子表达式。对于这种表达式，没有必要花时间再对它进行计算，只需要直接用前面计算过的表达式结果代替 E 就可以了。如果这种优化仅限于程序的基本块内，便称为局部公共子表达式消除，如果这种优化的范围涵盖了多个基本块，那就称为全局公共子表达式消除。举个例子说明它的优化过程，假如存在如下代码：

int d = (c * b) * 12 + a + (a + b * c);

如果这段代码交给 Javac 编译器则不会得到任何优化，当这段代码进入到虚拟机的即时编译器后，他将进行如下优化：编译器检测到 “cb” 与 “bc” 是一样的表达式，而且计算期间 b 与 c 的值是不变的。因此，这条表达式可能被视为：

int d = E * 12 + a + (a + E);

这时，编译器还可能进行另外一种优化：代数化简，把表达式变为：

int d = E * 13 + a * 2;

表达式进行变换后，在计算起来就可以节省一些时间了。

数组边界检查消除

数组边界检查消除是即时编译器中的一项语言相关的经典优化技术。Java 是一门动态安全的语言，大量的安全检查令编写 Java 程序比编写 C/C++ 程序容易的多，如数组越界会得到 ArrayIndexOutOfBoundsException 异常，空指针访问会得到 NullPointException 等。但这些安全检查也导致了相同的程序，Java 要比 C/C++ 做更多的事情，这些事情就成为一种隐式开销，要消除这种隐式开销，除了尽可能把运行期检查提到编译期完成的思路之外，还有另一种避免思路——隐式异常处理，Java 中空指针检查和算术运算中除数为零的检查都采用了这种思路。例如程序中访问一个对象的某个属性，以 Java 伪代码来表示虚拟机访问 foo.value 的过程如下：

if (foo != null) {
	return foo.value;
} else {
	throw new NullPointException();
}

使用隐式异常优化之后，虚拟机会把上面伪代码所表示的访问过程变为如下伪代码：

try {
	return foo.value;
} catch (segment_fault) {
	uncommon_trap();
}

虚拟机会注册一个 Segment Fault 信号的异常处理器，这样 foo 不为空时，对 value 的访问是不会额外消耗一次对 foo 判空的开销的。代价就是 foo 为空时，必须转入到异常处理器中恢复并抛出 NullPointException 异常，这个过程必须从用户态转到内核态中处理，结束后再回到用户态，速度远比一次判空检查慢。

方法内联

方法内联是编译器最重要的优化手段之一，除了消除方法调用的成本之外，它更重要的意义是为其他优化手段建立良好的基础，比如下面的代码中，testInline() 方法的内部全都是无用代码，如果不做内联，后续即使进行了无用代码消除的优化，也无法发现任何无用代码，因为如果分开来看，foo() 和 testInline() 两个方法里面的操作都可能是有意义的。

public static void foo(Object obj) {
	if (obj != null) {
		System.out.println("do somthing");
	}
}

public static void testInline(String[] args) {
	Object obj = null;
	foo(obj);
}

由于 Java 是动态语言，许多类型在编译时并不能得知，所以无法直接进行内联优化，这种动态类型的方法称为“虚方法”。
为了解决虚方法的内联问题，Java 虚拟机设计团队引入了一种名为“类型继承关系分析”（Class Hierarchy Analysis，CHA）技术，这是一个基于整个应用程序的类型分析技术，它用于确定在目前已加载的类中，某个接口是否有多于一种的实现，某个类是否存在子类、子类是否为抽象类等信息。
编译器在内联时，如果是非虚方法，那么直接进行内联，这时的内联是有稳定前提保障的。如果是虚方法，则会向 CHA 查询此方法在当前程序下是否有多个目标版本可供选择，如果只有一个版本，也可以进行内联，不过这种内联属于激进优化，需要预留一个“逃生门”，称为守护内联。如果加载导致了继承关系发生变化，那就需要抛弃已经编译的代码，退回到解释状态执行，或者重新进行编译。
如果 CHA 检测到有多个版本的目标方法可供选择，则编译器还会进行最后一次努力，使用内联缓存来完成方法内联，这是一个建立在目标方法正常入口之前的缓存，它的工作原理大致是：在未发生方法调用之前，内联缓存状态为空，当第一次调用发生后，缓存记录下方法接收者的版本信息，并且每次进行方法调用时都比较接收者的版本，如果以后进来的每次调用的方法接收者版本都是一样的，那这个内联还可以一直用下去，否则说明程序真正使用了虚方法的多态性，这时才会取消内联，查找虚方法表进行方法分派。

逃逸分析

逃逸分析与类型继承关系分析一样，并不是直接优化代码的手段，而是为其他优化手段提供依据的分析技术。
逃逸分析的基本行为就是分析对象动态作用域：当一个对象在方法中被定义之后，它可能被外部方法所引用，例如作为参数传递到其他方法中，称为方法逃逸。甚至可能被外部线程访问到，譬如赋值给类变量或可以在其他线程中访问的实例变量，称为线程逃逸。
如果能证明一个对象不会逃逸到方法或线程之外，也就是别的方法或线程无法通过任何途径访问到这个对象，则可能为这个变量进行一些高效的优化，如下所示：

栈上分配（Stack Allocation）：Java 虚拟机中，在 Java 堆上分配创建对象的内存空间，Java 堆中的对象对于各个线程都是共享和可见的，虚拟机的垃圾收集系统可以回收堆中不再使用的对象，但回收动作会消耗时间。如果确定一个对象不会逃逸出方法之外，那让这个对象在栈上分配内存将会是一个很不错的主意，对象所占用的内存空间就可以随栈帧出栈而销毁。在一般应用中，不会逃逸的局部对象所占比例很大，如果能使用栈上分配，那大量的对象就会随着方法的结束而自动销毁了，垃圾收集系统的压力将会小很多。
同步消除（Synchronization Elimination）：线程同步本身是一个相对耗时的过程，如果逃逸分析能确定一个变量无法被其他线程访问，那么对这个变量实施的同步措施就可以消除掉。
标量替换（Scalar Replacement）：标量是指一个数据已经无法再分解成更小的数据来表示了，Java 虚拟机中的原始数据类型（int、long 等数值类型以及 reference 类型等）都不能进一步分解，他们就可以称为标量。相反的，如果一个数据可以继续分解，就称为聚合量，Java 中的对象就是典型的聚合量。如果把一个对象 Java 对象拆散，根据程序访问的情况，将其使用到的成员变量恢复原始类型来访问就叫做标量替换。如果逃逸分析证明一个对象不会被外部访问，且这个对象可以被拆散的话，那程序真正执行的时候可能不在创建这个对象，而改为直接创建它的若干个被这个方法使用到的成员变量来代替。将对象拆分后，除了可以让对象的成员变量在栈上分配和读写外，还可以为后续进一步的优化手段创建条件。

nisen6477

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Java 程序编译与代码优化之编译优化技术

文章目录编译优化技术公共子表达式消除数组边界检查消除方法内联逃逸分析编译优化技术以一段代码来说明编译器是怎么优化代码的：优化前的原始代码：static class B { int value; final int get() { return value; }}public void foo() { y = b.get(); // ...do stuff... z =...
复制链接

扫一扫