Live Variable Analysis
存活变量分析判断在程序点p处变量v的值是否能在CFG中由p起始的某条路径中被使用,如果被使用了,那么v在p处存活,否则v就在p处死亡。
除了上面的定义,v在路径中也不能被重新定义 v不能在被使用前就被重定义 ,这样才是一个活变量。(此处错误理解重定义问题导致后面分析当中理解出了点错,思维死板,如果不小心听错了就会按部就班不做怀疑,很不好)
该分析可以被用于寄存器分配,如果在过程中寄存器满了,我们倾向于替换一个包含死变量的寄存器(也是一种编译优化)
理解Live Variables Analysis
- 我们仍然用01序列表示变量是否存活。例子中会用到。
该分析的核心
对于程序来说,我们顺着路径正向查找的成本会比较高,因为每一个地方都要递归地查找后面路径、记录信息,直到最后才能判断v是否存活。反向的话,我们可以将存活信息逆着路径传播,把算法变为迭代,成本就会降低。
传递过程:
在B的输出受输入和B处操作决定。
B处的输入(即在B点之前的存活变量)包含了,B之后仍然存活且没有被重定义的变量(绿色-红色),B处被重定义前已经被使用的变量(蓝色)。
我们可以从更实践的角度去理解这个问题,live variable其实就是我们定义之后被使用了的变量,IDE里面不为灰色的变量就是一个live variable。(但我仔细想了一下,这个直观的理解不够科学,没有充分地完成这个界定)
有点好奇,如果v在程序点P1被定义,程序点P2被使用,程序点P3被重定义,程序点P4再次被使用,路径为P1-P2-P3-P4,这个v的存活是什么状态 没有意义,我们考虑他是否存活过即可,我们不需要明确他在全过程的生命周期是怎么变化的。
算法和之前可达性分析一样花里胡哨,其实就是从后往前计算每个点位的存活变量
例子
分析类似,看IN中是否有变化,有变化就再次迭代到没有变化为止。
Available Expressions Analysis
如果所有从入口到p的路径上都要执行x op y表达式,并且在最后一此执行该表达式,没有对xy重定义,那么我们认为该表达式在程序点p上是available的。
- 定义意味着在程序点p,我们可以把x op y换成最后一次执行的结果。
- 我们可以用来检测全局通用的子表达式
理解Available Expressions Analysis
- 我们仍然用01序列表示表达式是否available。例子中会用到。
该分析的核心
传递过程:
涉及到变量的表达式去掉,添加新的表达式。
我们可以把(e^16)*x替换为t
但为了安全,我们可能会漏报。
在x的值重定义为相同值时,所示的结果是可以替换的,但是为了安全我们就不做替换,漏报。
举个例子
总结
比较三个分析
- 理解三种数据流分析:
- 定义可达性
- 存活变量
- available的表达式
- 可以分辨三种数据流分析的不同和相似之处
- 理解迭代算法并了解为什么算法可以结束