总结:编译原理--第十一章 并行性和局部性优化

本文详细介绍了编译器如何优化处理数组的计算密集型程序,增强其在多处理器系统上的并行性和局部性,以提高运行效率。重点讨论了仿射访问、迭代空间、数据依赖、矩阵秩、丢番图方程、基本代码转换、并行运算同步、流水线化等关键概念和技术。这些方法包括循环融合、分块、条状挖掘等,旨在提升程序的执行速度和数据访问的局部性。
摘要由CSDN通过智能技术生成

第十一章  并行性和局部性优化

本章介绍一个编译器如何增强处理数组的计算密集型程序中的并行性和局部性,以便提高目标程序在多处理器系统上的运行速度。

  • 数组的并行性和局部性。对于并行性和基于局部性的优化而言,最重要的机会来自于访问数组的循环。
  • 仿射访问。几乎所有的并行化及数据局部性优化的理论和技术都假设对数组的访问是仿射的:这些数组下标的表达式是循环下标的线性函数。
  • 迭代空间:一个具有 d 个循环的循环嵌套结构定义了一个 d 维的迭代空间。
  • Fourier-Motzkin 消除算法。对迭代空间的关键操作之一是把定义该空间的各个循环重新排列。
  • 数据依赖和数组访问。在为了并行性和局部性优化的目的而处理循环时,我们需要解决的一个中心问题是确定两个数组访问之间是否具有数据依赖关系。
  • 矩阵的秩和数据复用。用来描述一个数组访问的矩阵可以给出多个关于该数组访问的重要信息。
  • 数据依赖关系和丢番图方程。如果我们仅仅知道对同一数组的两个访问触及该数组的同一区域,我们并不能判定它们是否真的访问了某个公共元素。
  • 解丢番图线性方程。关键技术是计算各个变量的系数的最大公约数。
  • 空间分划约束。为了并行化一个循环嵌套结构的执行过程,我们需要把这个循环的迭代映射到一个处理器空间。
  • 基本代码转换。用来并行化具有仿射数组访问的程序的转换是七个基
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值