【程序分析】数据依赖、控制依赖、程序依赖图PDG、系统依赖图SDG

最新推荐文章于 2024-09-12 10:30:42 发布

AD_钙

最新推荐文章于 2024-09-12 10:30:42 发布

阅读量1.3w

点赞数 12

分类专栏：知识杂记文章标签：其他

原文链接：https://zhuanlan.zhihu.com/p/324696483

版权

知识杂记专栏收录该内容

4 篇文章

订阅专栏

转载整理自程序依赖相关知识点(PDG,SDG).供自己学习

1. 预备知识:可达性的定义

存在变量 v

定义d：对变量v的赋值语句称为变量v的定义
使用：在某个表达式中引用变量v的值
kill:变量v被再次赋值时，上一次赋值对变量v的定义d就被kill掉了
d可以到达p:定义d到点p之间存在一条路径，且在路径中定义d没有被kill掉

下图为转载文章中截的图

在这里插入图片描述

d可以通过path2到达u但是不能通过path1到达u，因为k这条语句kill掉了定义d
因为d到u之间存在着没有被kill的路径path2，所以d可以到达u
*X = . 叫做精确定义，p = . 叫做模糊定义，因为p可能指向X
一般考虑可达性只考虑精确定义对路径的kill

2. 数据依赖

两个句子存在数据依赖：一条语句中一个变量的定义，可以到达另一条语句中对该变量的使用
在编译领域有不同类型的数据依赖，如果s2依赖于s1，可以是：

s1 写内存 s2 读 (RAW)
s1 读内存 s2 写 (WAR)
s1 写内存 s2 写 (WAW)
s1 读内存 s2 读 (RAR)

在软件工程领域，主要关注RAW依赖，在源码或IR层度上。

DU-chains: def-use chains 优点是可以快速得到数据依赖，缺点是必须不断计算和更新，空间开销大
数据依赖图: 将每个语句作为结点，箭头作为有向边
SSA：static single assignment 每一次赋值都由一个不同的变量表示
- 优点:使得分析变得简单高效
- 缺点是需要添加额外的条件才能正确执行，时空开销大。

如下图所示，转换为SSA就是使得每个变量只有一次定义。转换过程有两个步骤:

为对每一个定义重命名
对所有定义能到达的使用重命名

3. 控制依赖图

控制依赖图由控制流图和FDT(Forward dominance Tree)产生

FDT就是前向支配树
d支配（dominate）n，记为d dom n：每一条从流图的入口结点到结点n的路径都经过结点d 。在这个定义下每个结点都支配它自己
如下图所示，左侧为流图，右侧为其对应的支配树。

在支配树（dominator tree）中，对于结点n来说:
从根节点到结点n所在路径上的结点都严格支配结点n，例如上图中从根节点1 -> 2 -> 3，其中结点1和结点2都严格支配结点3
该路径上离结点n最近的结点叫做结点n的直接支配结点（immediate node），用IDom(n)表示，例如上图中IDom(6) = 2

前向支配树（FDT）指的就是根节点为函数出口的支配树，也就是上图的翻转，如下图所示，右侧为左侧函数对应的FDT(比如5->2的箭头表示，所有从函数出口到2的路径都一定会经过5，因此5是2的主导)：
在这里插入图片描述
得到FDT后将其与控制流图结合即可得到控制依赖图如下

4. PDG：程序依赖图

程序依赖图：

结点代表语句
边代表依赖关系，依赖关系包括数据依赖和控制依赖

数据依赖：

s1: A = B * C;
s2: D = A * E + 1
由于s1语句变量A在s2语句中被读，因此称s2数据依赖于s1

控制依赖：
s1: if (A) then

s2:  B = C * D
    endif
由于s1语句变量A的值决定了s2语句是否被执行，因此称s2控制依赖于s1

控制依赖用实箭头表示，数据依赖用虚箭头表示
在这里插入图片描述
构建系统依赖图的流程：

做出其控制流图
从中找到控制依赖图和数据依赖图
结合起来即得到PDG图

5. SDG：系统依赖图

系统依赖图:在PDG的基础上增加了一些点和边将整个系统整合在一起表示，对于系统中主函数的依赖图称为program dependence graph，对于其余函数称为procedure dependence graphs

SDG中增加了5类新的结点：
1）调用点
2）actual-in结点：它是具有与调用点相关的控制依赖，将实参的值传入一个临时单元中(例如x_in)
3) actual-out结点：也是具有与调用点相关的控制依赖，将临时单元中的值返回给实参
4）formal-in结点：它是具有与被调函数入口相关的控制依赖，将临时单元中的值复制给形参
5）formal-out结点：也是具有与被调函数入口相关的控制依赖，将形参中的值返回给临时单元

SDG中增加了3类新的边：
1）从调用点指向被调函数入口结点的边
2）parameter-in边：actual-in结点指向formal-in结点的边(相当于实参->临时单元->形参)
3）parameter-out边: formal-out结点指向actual-out结点的边(相当于上述过程的返回过程)

一个SDG图的例子如下：
在这里插入图片描述
生成SDG的步骤：