寄存器分配,是通过将程序变量尽可能地分配到寄存器,从而提高程序执行速度的一种方法。寄存器是编译器优化中最为重要的问题之一(好的寄存器分配能够提高程序执行速度超过250%);也是编译器理论中最热点的研究领域之一(研究界已经提出来大量寄存器分配相关的算法)。
但是,寄存器分配不仅仅是图着色的问题。当寄存器数目不足以分配某些变量时,就必须将这些变量溢出到内存中,该过程成为spill。最小化溢出代价的问题,也是一个NP-complete问题。如果简化该问题——假设所有溢出代价相等,那么最小化溢出代价的问题,等价于k着色问题,仍然是NP-complete问题。
此外,如果两个变量的生命期仅仅因为出现在同一个拷贝指令中而相邻,那么,通过将这两个变量分配到同一个寄存器,就可以消除该拷贝指令,成为coalescing。这个方向的努力在Chaitin的文章以后的1/4个世纪,成为推动寄存器分配的主要动力之一,涌现出了包括aggressive coalescing,conservative coalescing和optimistic coalescing。但是,将两个变量分配到同一个寄存器,等价于将这两个变量合并成同一个变量,生命期合并,因而会加剧相交图的聚簇现象,降低相交图的可着色性。Bouchez等人证明了目前的coalescing问题都是NP-complete的。
为了降低相交图的聚簇现象,提高相交图的可着色性,可以通过将变量拷贝给一个临时变量,并将以后对该变量的使用替换成对该临时变量的使用,从而将一个变量的生命期分解成两个变量的生命期,称为live range splitting。显然,这是一个与coalescing的作用相反的过程。Bouchez等人考虑了该方法的复杂度。
此外,寄存器分配还需要考虑寄存器别名(aliasing)和预着色(pre-coloring)的问题。寄存器别名是指,在某些体系结构中,一个寄存器的赋值可能会影响到另外一个寄存器。比如,在x86中,对AX寄存器的赋值,会影响AL和AH寄存器。预着色是指,某些变量必须被分配到特定的寄存器。比如,许多体系结构会采用特定寄存器来传递函数参数。
George和Appel发展了Chaitin的算法,更好地考虑了coalescing过程和赋值过程,以及各过程之间的迭代,在基于图着色的寄存器分配方法中具有广泛的影响。
线性扫描算法(linear scan)最早由Poletto和Sarkar提出,具有很大的影响力,在gcc、llvm和Java HotSpot编译器中得到了实现。线性扫描算法简化了基于图着色的分配问题,考虑的是对一个有序的生命期序列的着色,提高了寄存器分配的速度(线性速度),而没有过度降低对寄存器的利用。
Goodwin和Wilken提出了最早的对寄存器分配问题的整数线性规划算法(integer linear programming),虽然在最坏情况下具有指数级复杂度,但是能够更充分的利用寄存器。
在编译器领域,Partitioned Boolean Quadratic Problem被用于解决指令选择和寄存器分配问题。对于寄存器分配而言,PBQP算法的复杂度为VK^3,其中V是变量的数目,K是寄存器的数目。Hames等人的实验表明,他们的PBQP实现能够为SPEC CPU 2000中的97.4%的函数找到最优寄存器分配方案。
Koes和Goldstein等人最先将寄存器分配视为Multi-Flow Commodities问题加以解决。
1. 图着色(graph coloring)方法是解决寄存器分配问题最常用的方法。
利用相交图(interference graph)来表示程序变量的生命期是否相交,将寄存器分配给变量的问题,可以近似地看成是给相交图着色:相交图中,相交的节点不能着同一颜色;每一种颜色对应一个寄存器。Chaitin等人最早提出了基于图着色的寄存器分配方法其着色思路采用了Kempe的着色方法,即,任意一个邻居节点数目少于k的节点,都能够被k着色。判断一个图是否能够被k(k>=3)种颜色着色,即k着色问题,被Karp证明是一个NP-complete问题。
3. 线性扫描算法
4. 整数线性规划算法
5. PBQP算法
6. Multi-Flow Commodities算法
7. 基于Static Single Assignment (SSA)的寄存器分配
寄存器分配问题的一个重要突破发生在2005年,当时3个研究团队独立的证明了,采用SSA表示的程序的相交图是弦图(chordal graph)。而弦图是能够在多项式时间内着色的。基于SSA形式的寄存器分配方法,可以从三个方面获益:更小的寄存器压力;spilling和寄存器赋值过程之间的分离;更简单的寄存器赋值算法。