编写高效程序需要做到三点:1.必须选择一组适当的算法和数据结构;2.必须编写出编译器能够有效优化以转换成高效可执行代码的源代码(对于这一点,理解优化编译器的能力和局限性很重要);3.将一个任务分成多个部分,这些部分可以在多核和多处理器的某种组合上并行计算。对于优化程序的一个挑战就是尽管做了大量的变化,但还是要尽量维护代码的简洁和可读性。
程序优化的第一步就是消除不必要的工作,让代码尽可能有效地执行所期望的任务。包括不必要的函数调用、条件测试和内存引用。
为了使程序性能最大化,程序员和编译器都需要知道一个模型,用来指明目标机器如何处理指令,以及各个操作的时序特性(比如知道了时序信息,就能确定是用一条乘法还是用移位和加法的组合)。文中给出了一种图形数据流表示法(基于Intel和AMD处理器),可以使处理器对指令的执行形象化,可以利用它预测程序的性能。
了解处理器运作后,可以进行程序优化的第二步,利用处理器提供的指令级并行能力,同时执行多条指令。比如降低一个程序不同部分的数据相关程度,增加并行度,这样就可以同时执行这些部分了。
优化编译器的能力和局限性
GCC可以通过“-o1”、“-o2”、“-o3”来控制优化级别,更大的数字代表更大量的优化,这样可以更好的提高性能,但也会让程序规模变大,也更难以用标准的调试工具进行调试。
优化可能会使语言和编码风格变得混乱,降低程序的可读性和模块性,程序易出错,难以修改和扩展