《深入理解计算机系统》学习笔记——优化程序性能

本文探讨了优化程序性能的多个方面,包括理解编译器的优化能力、衡量程序性能的标准、现代处理器的工作原理及限制。通过实例解析了如何通过循环展开、并行计算、重新结合变换等技术提高程序性能,同时也讨论了内存性能、寄存器溢出、分支预测等因素对性能的影响。优化程序性能的关键策略包括选择合适的算法和数据结构、遵循编码最佳实践以及低级优化,如循环展开和指令级并行利用。
摘要由CSDN通过智能技术生成

优化程序性能

编写高效程序需要做到以下几点:
第一,我们必须选择一组适当的算法和数据结构。
第二,我们必须编写出编译器能够有效优化以转换成高效可执行代码的源代码。
第三项技术针对处理运算量特别大的计算,将一个任务分成多个部分,这些部分可以在多核和多处理器的某种组合上并行地计算。

优化编译器的能力和局限性

void twiddlel(long *xp, long *yp)*xp  += *yp;
*xp  += *yp;
void twiddle2(long *xp, long *yp)*xp += 2* *yp;

上述两个程序都是将存储在由指针 yp 指示的位置处的值两次加到指针 xp 指示的位置处的值。
另一方面, 函数 twiddle2 效率更高一些。它只要求 3 次内存引用(读 *xp , 读 *yp , 写 *xp ),而 twiddle1 需要 6 次( 2 次读 *xp , 2次读 *yp, 2 次写 *xp)。
因此,如果要编译器编译过程 twiddle1, 我们会认为基于 twiddle2执行的计算能产生更有效的代码。

如果编译器不能确定两个指针是否指向同一个位置,就必须假设什么情况都有可能,这就限制了可能的优化策略。

第二个妨碍优化的因素是函数调用。

表示程序性能

引入度量标准每元素的周期数 ( Cycles Per Element, CPE), 作为一种表示程序性能并指导我们改进代码的方法 。
CPE 这种度量标准帮助我们在更细节的级别上理解迭代程序的循环性能。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值