C++手动开启O2优化（以及-O -O1 -O2 -O3优化的知识点）（竞赛可用）

最新推荐文章于 2024-02-21 13:48:41 发布

mlm5678

最新推荐文章于 2024-02-21 13:48:41 发布

阅读量8.5k

点赞数 9

分类专栏： ac STL

本文链接：https://blog.csdn.net/mlm5678/article/details/85213084

版权

ac 同时被 2 个专栏收录

95 篇文章 0 订阅

订阅专栏

STL

21 篇文章 1 订阅

订阅专栏

说白了这是一种堆栈段优化。

大概就是让编译器把所有能预处理的全算出来。牺牲编译时间换取运行时间。

一般来说，如果不指定优化标识的话，gcc就会产生可调试代码，每条指令之间将是独立的：可以在指令之间设置断点，并且把获取最快的编译速度作为它的目标。当优化标识被启用之后，gcc编译器将会试图改变程序的结构（当然会在保证变换之后的程序与源程序语义等价的前提之下），以满足某些目标，如：代码大小最小或运行速度更快（只不过通常来说，这两个目标是矛盾的，二者不可兼得）。

-O0：不做任何优化，这是默认的编译选项。

-O和-O1：对程序做部分编译优化，对于大函数,优化编译占用稍微多的时间和相当大的内存。使用本项优化，编译器会尝试减小生成代码的尺寸，以及缩短执行时间，但并不执行需要占用大量编译时间的优化。打开的优化选项：

O2优化能使程序的编译效率大大提升。

从而减少程序的运行时间，达到优化的效果。

C++程序中的O2开关如下所示：

#pragma GCC optimize(2)
或
#pragma GCC optimize(“O2”)

同理O1、O3优化只需修改括号中的数即可。

只需将这句话放到程序的开头即可打开O2优化开关。

下面这段留着我进阶以后看吧。

编译器优化级别1(O1)

在优化的第一个级别执行基础代码的优化

这个级别试图执行9种单独的优化功能：

（1）.-fdefer-pop: 这种优化技术与汇编语言代码在函数完成时如何进行操作有关。

（2）.-fmerge-constans: 使用这种优化技术, 编译器试图合并相同的常量.

(3) . -fthread-jumps: 使用这种优化技术与编译器如何处理汇编代码中的条件和非条件分支有关。在某些情况下, 一条跳转指令可能转移到另一条分支语句。通过一连串跳转, 编译器确定多个跳转之间的最终目标并且把第一个跳转重新定向到最终目标。

(4).-floop-optimize:通过优化如何生成汇编语言中的循环，编译器可以在很大程序上提高应用程序的性能。通常, 程序由很多大型且复杂的循环构成。通过删除在循环内没有改变值的变量赋值操作, 可以减少循环内执行指令的数量, 在很大程度上提高性能。此外优化那些确定何时离开循环的条件分支，以便减少分支的影响。

(5).-fif-conversion: if-then语句应该是应用程序中仅次于循环的最消耗时间的部分。简单的if-then语句可能在最终的汇编语言代码中产生众多的条件分支。通过减少或者删除条件分支, 以及使用条件传送设置标志和使用运算技巧来替换他们, 编译器可以减少if-then语句中花费的时间量。

（6）-fif-conversion2: 这种技术结合更加高级的数学特性，减少实现if-then语句所需的条件分支。

（7）-fdelayed-branch: 这种技术试图根据指令周期时间重新安排指令。它还试图把尽可能多的指令移动到条件分支前, 以便最充分的利用处理器的治理缓存。

(8) -fguess-branch-probability:就像其名称所暗示的, 这种技术试图确定条件分支最可能的结果, 并且相应的移动指令, 这和延迟分支技术类似。因为在编译时预测代码的安排，所以使用这一选项两次编译相同的c或者c++代码很可能会产生不同的汇编语言代码，这取决于编译时编译器认为会使用那些分支。

（9）-fcprop-registers: 因为在函数中把寄存器分配给变量, 所以编译器执行第二次检查以便减少调度依赖性(两个段要求使用相同的寄存器)并且删除不必要的寄存器复制操作。

编译器优化级别(O2)

结合了第一个级别的所有优化技术,再加上一下一些优化：

（1）-fforce-mem: 这种优化在任何指令使用变量前, 强制把存放再内存位置中的所有变量都复制到寄存器中。对于只涉及单一指令的变量, 这样也许不会有很大的优化效果. 但是对于在很多指令(必须数学操作)中都涉及到的变量来说, 这会时很显著的优化, 因为和访问内存中的值相比 ,处理器访问寄存器中的值要快的多。

（2）-foptimize-sibling-calls: 这种技术处理相关的和/或者递归的函数调用。通常,递归的函数调用可以被展开为一系列一般的指令，而不是使用分支。

（3）-fstrength-reduce: 这种优化技术对循环执行优化并且删除迭代变量。迭代变量是捆绑到循环计数器的变量, 比如使用变量, 然后使用循环计数器变量执行数学操作的for-next循环。

（4）-fgcse：这些优化操作试图分析生成的汇编语言代码并且结合通用片段，消除冗余的代码段。如果代码使用计算性的goto,gcc指令推荐

（5）-fcse-follow-jumps: 这种特别的通用子表达式消除技术扫描跳转指令, 查找程序中通过任何其他途径都不会到达的目标代码。这种情况最常见的例子就式if-then-else语句的else部分。

（6）-frerun-cse-after-loop: 这种技术在对任何循环已经进行过优化之后重新运行通用子表达式消除例程。这样确保在展开循环代码之后更进一步地优化还编代码。

（7）-fdelete-null-pointer-checks: 这种优化技术扫描生成的汇编语言代码, 查找检查空指针的代码。

（8）-fextensive-optimizations: 这种技术执行从编译时的角度来说代价高昂的各种优化技术，但是它可能对运行时的性能产生负面影响。

（9）-fregmove: 编译器试图重新分配mov指令中使用的寄存器, 并且将其作为其他指令操作数, 以便最大化捆绑的寄存器的数量。

（10）-fschedule-insns: 编译器将试图重新安排指令, 以便消除等待数据的处理器。对于在进行浮点运算时有延迟的处理器来说，这使处理器在等待浮点结果时可以加载其他指令。

（11）-fsched-interblock: 这种技术使编译器能够跨越指令块调度指令。这可以非常灵活地移动指令以便等待期间完成的工作最大化。

（12）-fcaller-saves: 这个选项指示编译器对函数调用保存和恢复寄存器, 使函数能够访问寄存器值, 而且不必保存和恢复他们。如果调用多个函数, 这样能够节省时间, 因为只进行一次寄存器的保存和恢复操作, 而不是在每个函数调用中都进行。

（13）-fpeephole2: 这个选项允许进行任何计算机特定的观察孔优化。

（14）-freorder-blocks: 这种优化技术允许重新安排指令块以便改进分支操作和代码局部性。

（15）-fstrict-aliasing: 这种技术强制实行高级语言的严格变量规则。对于c和c++程序来说, 它确保不在数据类型之间共享变量. 例如, 整数变量不和单精度浮点变量使用相同的内存位置。

(16)-funit-at-a-time:这种优化技术指示编译器在运行优化例程之前读取整个汇编语言代码。这使编译器可以重新安排不消耗大量时间的代码以便优化指令缓存。

(17)-falign-functions:这个选项用于使函数对准内存中特定边界的开始位置。大多数处理器按照页面读取内存，并且确保全部函数代码位于单一内存页面内, 就不需要叫化代码所需的页面。

（18）-fcrossjumping: 这是对跨越跳转的转换代码处理，以便组合分散在程序各处的相同代码。这样可以减少代码的长度，但是也许不会对程序性能有直接影响。

mlm5678

关注

9
点赞
踩
39

收藏

觉得还不错? 一键收藏
0
评论
C++手动开启O2优化（以及-O -O1 -O2 -O3优化的知识点）（竞赛可用）

说白了这是一种堆栈段优化。大概就是让编译器把所有能预处理的全算出来。牺牲编译时间换取运行时间。一般来说，如果不指定优化标识的话，gcc就会产生可调试代码，每条指令之间将是独立的：可以在指令之间设置断点，并且把获取最快的编译速度作为它的目标。当优化标识被启用之后，gcc编译器将会试图改变程序的结构（当然会在保证变换之后的程序与源程序语义等价的前提之下），以满足某些目标，如：代码大小最小或运...
复制链接

扫一扫