GCC编译器优化选项分析及具体优化了什么

最新推荐文章于 2024-08-16 16:40:31 发布

茜茜她老爹

最新推荐文章于 2024-08-16 16:40:31 发布

阅读量2.3k

点赞数

分类专栏： gcc

gcc 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

起因：

目前项目使用nios IDE作为开发平台，其使用的编译器为gcc的交叉编译器。在设定编译条件时，在debug模式下生成的程序正常，但是在release模式下会出现LCD显示的开端显示不全，缺少一个字节或字的状况。为了了解具体为什么造成该问题，对两种模式下的配置做了对比，编译器皆为nios2-elf-gcc交叉编译器，debug模式编译器参数为：-DALT_DEBUG -O0 -g –Wall。release模式编译器参数为: -DALT_RELEASE -O2 -g –Wall。

两种模式下的参数简单说明如下

-DALT_DEBUG：目前没有明确资料显示该项的具体作用，根据命名可认为与调试有关选项。且两种模式下都有，暂时认为不会造成差异。

-O0: gcc编译器默认优化等级。

-g：gdb调试器支持选项用于在编译时生成相关调试信息。

-Wall：打开所有编译器告警选项，即编译器最严格告警模式。

-O2：gcc编译高于O0低于O3的编译优化选项。

通过对比可以发现两种模式主要的不同在于编译器优化程度不同，那么编译器在两种优化下究竟做了什么优化那？是否由这些问题造成的显示丢失问题那？？现在我们来看看gcc编译器的优化参数到底做了什么优化。（注：由于关于nios2-elf-gcc的文档资料十分稀少，不能形成可分析的文档，所以以通用的gcc作为分析，毕竟同出一源）

正文：

GCC编译器优化选项介绍：

GCC编译器在目前是不是用最多的编译器也相去不远，尤其在嵌入式领域很多编译器都是基于GCC的cross gcc版本。毕竟功能成熟而且有开放的源代码。

这里只介绍优化编译的参数

-O用来开启优化编译选项。

-O0：默认模式，不做任何优化。

-O1：优化。该模式下对于一个大的函数或功能会花费更多的时间和内存。

在-O1下：编译会尝试减少代码体积和代码运行时间。但是并不执行会花费大量时间的优化操作。

在该模式下将打开一下优化选项:

-fdefer-pop

- -fdelayed-branch

- -fguess-branch-probability

- -fcprop-registers

- -floop-optimize

- -fif-conversion

- -fif-conversion2

- -ftree-ccp

- -ftree-dce

- -ftree-dominator-opts

- -ftree-dse

- -ftree-ter

- -ftree-lrs

- -ftree-sra

- -ftree-copyrename

- -ftree-fre

- -ftree-ch

- -funit-at-a-time

- -fmerge-constants

该模式下在不影响调试的状况下还会打开‘-fomit-frame-pointer优化项。

同时该模式不会为Ada编译器打开 ‘-ftree-sra’优化项，如需要则请使用命令参数输入‘-ftree-sra’进行优化。

-O2:进一步优化.GCC执行几乎所有支持的操作但不包括空间和速度之间权衡的优化。-O2优化等级下，并不执行循环展开和函数“内联”^【注¹^】优化操作。与-O1比较该优化-O2将会花费更多的编译时间当然也会生成性能更好的代码。-O2除了打开-O1的所有优化参数外还打开以下优化选项。

-fthread-jumps

-fcrossjumping

-foptimize-sibling-calls

-fcse-follow-jumps -fcse-skip-blocks

-fgcse -fgcse-lm

-fexpensive-optimizations

-fstrength-reduce

-frerun-cse-after-loop -frerun-loop-o

-fcaller-saves

-fpeephole2

-fschedule-insns -fschedule-insns2

-fsched-interblock -fsched-spec

-fregmove

-fstrict-aliasing

-fdelete-null-pointer-checks

-freorder-blocks -freorder-functions

-falign-functions -falign-jumps

-falign-loops -falign-labels

-ftree-vrp

-ftree-pre

还要注意-fgcse下关于请求-O2优化等级的用于计算goto的程序。

-O3：更进一步优化。-O3打开-O2指定的所有优化操作并且打开：

-finline-functions

-funswitch-loops

-fgcse-after-reload

优化项。

-Os：针对程序空间大小优化（多用于嵌入式系统）。-Os使能-O2中除去会增加程序空间的所有优化参数。同时-Os还会执行更加优化程序空间的选项。

-Os会关闭以下优化选项：

-falign-functions

-falign-jumps

-falign-loops

-falign-labels

-freorder-blocks

-freorder-blocks-and-partition

-fprefetch-loop-arrays

-ftree-vect-loop-version

关于GCC编译的优化选项一共有-O0（默认），-O1，-O2，-O3及-Os五个参数。各个参数优选内容如上所示。但是各个优化内容到底是指什么那？继续分析。

2.优化具体参数含义。（共计49项）

-fdefer-pop

推迟推出函数调用的参数，对于那些需要在函数调用后必须取出（pop）函数参数的机器而言，打开该项编译器将把函数调用的参数压入栈，等必要时几个函数调用参数一起取出（pop）。这将节省处理时间。

-fdelayed-branch

如果对目标机支持这个功能,它试图重新排列指令,以便利用延迟分支(delayed branch)指令后面的指令空隙.

-fguess-branch-probability

使用启发式算法预测分之指令，增加指令的命中率，提升运行效果。

-fcprop-registers

使用寄存器之间copy-propagation传值;

因为在函数中把寄存器分配给变量, 所以编译器执行第二次检查以便减少
调度依赖性(两个段要求使用相同的寄存器)并且删除不必要的寄存器复制操作

-floop-optimize

通过优化如何生成汇编语言中的循环，编译器可以在很大程序上提高应用程序的性能。通常, 程序由很多大型且复杂的循环构成。通过删除在循环内没有改变值的变量赋值操作, 可以减少循环内执行指令的数量, 在很大程度上提高性能。此外优化那些确定何时离开循环的条件分支，以便减少分支的影响。

-fif-conversion

if-then语句应该是应用程序中仅次于循环的最消耗时间的部分。
简单的if-then语句可能在最终的汇编语言代码中产生众多的条件分支。通过减少
或者删除条件分支, 以及使用条件传送设置标志和使用运算技巧来替换他们, 编译
器可以减少if-then语句中花费的时间量。

-fif-conversion2

这种技术结合更加高级的数学特性，减少实现if-then语句所
需的条件分支。

-ftree-ccp

Perform sparse conditional constant propagation (CCP) on trees. This pass

only operates on local scalar variables and is enabled by default at ‘-O’ and

higher.

-ftree-dce

编译器将消除无用的不会被执行的代码（dead code）

-ftree-dominator-opts

Perform a variety of simple scalar cleanups (constant/copy propagation, redun-

dancy elimination, range propagation and expression simpliﬁcation) based on a

dominator tree traversal. This also performs jump threading (to reduce jumps

to jumps). This ﬂag is enabled by default at ‘-O’ and higher.

-ftree-dse

-ftree-ter

Perform temporary expression replacement during the SSA->normal phase. Sin-

gle use/single def temporaries are replaced at their use location with their deﬁn-

ing expression. This results in non-GIMPLE code, but gives the expanders

much more complex trees to work on resulting in better RTL generation. This

is enabled by default at ‘-O’ and higher.

-ftree-lrs

Perform live range splitting during the SSA->normal phase. Distinct live ranges

of a variable are split into unique variables, allowing for better optimization

later. This is enabled by default at ‘-O’ and higher.

-ftree-sra

-ftree-copyrename

-ftree-fre

-ftree-ch

-funit-at-a-time

-fmerge-constants

-fthread-jumps

-fcrossjumping

-foptimize-sibling-calls

-fcse-follow-jumps

-fcse-skip-blocks

-fgcse -fgcse-lm

-fexpensive-optimizations

-fstrength-reduce

-frerun-cse-after-loop

-frerun-loop-o

-fcaller-saves

-fpeephole2

-fschedule-insns

-fschedule-insns2

-fsched-interblock

-fsched-spec

-fregmove

-fstrict-aliasing

-fdelete-null-pointer-checks

-freorder-blocks

-freorder-functions

-falign-functions

-falign-jumps

-falign-loops

-falign-labels

-ftree-vrp

-ftree-pre

-finline-functions

允许编译器选择某些简单的函数在其被调用处展开，比较安全的选项，特别是在CPU二级缓存较大时建议使用。

-funswitch-loops

-fgcse-after-reload

茜茜她老爹

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。