第十一章 并行性和局部性优化
本章介绍一个编译器如何增强处理数组的计算密集型程序中的并行性和局部性,以便提高目标程序在多处理器系统上的运行速度。
- 数组的并行性和局部性。对于并行性和基于局部性的优化而言,最重要的机会来自于访问数组的循环。
- 仿射访问。几乎所有的并行化及数据局部性优化的理论和技术都假设对数组的访问是仿射的:这些数组下标的表达式是循环下标的线性函数。
- 迭代空间:一个具有 d 个循环的循环嵌套结构定义了一个 d 维的迭代空间。
- Fourier-Motzkin 消除算法。对迭代空间的关键操作之一是把定义该空间的各个循环重新排列。
- 数据依赖和数组访问。在为了并行性和局部性优化的目的而处理循环时,我们需要解决的一个中心问题是确定两个数组访问之间是否具有数据依赖关系。
- 矩阵的秩和数据复用。用来描述一个数组访问的矩阵可以给出多个关于该数组访问的重要信息。
- 数据依赖关系和丢番图方程。如果我们仅仅知道对同一数组的两个访问触及该数组的同一区域,我们并不能判定它们是否真的访问了某个公共元素。
- 解丢番图线性方程。关键技术是计算各个变量的系数的最大公约数。
- 空间分划约束。为了并行化一个循环嵌套结构的执行过程,我们需要把这个循环的迭代映射到一个处理器空间。
- 基本代码转换。用来并行化具有仿射数组访问的程序的转换是七个基