计算机系统——优化程序性能
优化程序性能
编写高效程序需要做到以下几点:
第一,我们必须选择一组适当的算法和数据结构。
第二,我们必须编写出编译器能够有效优化以转换成高效可执行代码的源代码。
第三项技术针对处理运算量特别大的计算,将一个任务分成多个部分,这些部分可以在多核和多处理器的某种组合上并行地计算。
优化编译器的能力和局限性
void twiddlel(long *xp, long *yp)
{
*xp += *yp;
*xp += *yp;
}
void twiddle2(long *xp, long *yp)
{
*xp += 2* *yp;
}
上述两个程序都是将存储在由指针 yp 指示的位置处的值两次加到指针 xp 指示的位置处的值。
另一方面, 函数 twiddle2 效率更高一些。它只要求 3 次内存引用(读 *xp , 读 *yp , 写 *xp ),而 twiddle1 需要 6 次( 2 次读 *xp , 2次读 *yp, 2 次写 *xp)。
因此,如果要编译器编译过程 twiddle1, 我们会认为基于 twiddle2执行的计算能产生更有效的代码。
如果编译器不能确定两个指针是否指向同一个位置,就必须假设什么情况都有可能,这就限制了可能的优化策略。
第二个妨碍优化的因素是函数调用。
表示程序性能
引入度量标准每元素的周期数 ( Cycles Per Element, CPE), 作为一种表示程序性能并指导我们改进代码的方法 。
CPE 这种度量标准帮助我们在更细节的级别上理解迭代程序的循环性能。