GCC的参数-ftree-vectorizer-verbose=n

This option controls the amount of debugging output the vectorizer prints. This information is written to standard error, unless ‘-fdump-tree-all’ or ‘-fdump-tree-vect’ is specified, in which case it is output to the usual dump listing file, ‘.vect’.

For n=0 no diagnostic information is reported.

If n=1the vectorizer reports each loop that got vectorized, and the total number of loops that got vectorized.

If n=2 the vectorizer also reports non-vectorized loops that passed the first analysis phase (vect analyze loop form) - i.e. countable,inner-most, single-bb, single-entry/exit loops. This is the same verbosity level that ‘-fdump-tree-vect-stats’ uses. Higher verbosity levels mean either more information dumped for each reported loop, or same amount of informationreported for more loops:

if n=3, vectorizer cost model informationis reported.

If n=4, alignment related information is added to the reports.

If n=5, data-references related information (e.g. memory dependences, memory access-patterns) is added to the reports.

If n=6, the vectorizer reports also nonvectorized inner-most loops that did not pass the first analysis phase (i.e., may not be countable, or may have complicated control-flow).

If n=7, the vectorizer reports also non-vectorized nested loops.

If n=8, SLP related information is added to the reports.

For n=9, all the information the vectorizer generates during its analysis and transformation is reported. This is the same verbosity level that ‘-fdump-tree-vect-details’ uses.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
-fira-algorithm=CB是一种基于域的内联优化,它会检查每个域中的函数,并根据其可能的域特性和关系来决定内联哪些函数。它可以有效地避免潜在的低效内联,提高程序性能。 -fira-region=one是一种基于区域的内联优化,它将整个程序分解为一个或多个区域,并优化每个区域独立进行内联。 -flifetime-dse=2是一种用于处理变量和内存空间的优化算法,它会分析变量的生存期并对存储空间进行优化,从而减少内存的使用。 -freorder-blocks-algorithm=stc是一种基于统计的块重排优化算法,它会根据代码的使用情况和块的特征重新排列块,从而有效提高程序性能。 -fstack-reuse=none是一种用于控制堆栈空间分配的优化选项,它可以有效地避免在程序中过度分配堆栈空间,从而减少内存的使用。 -fvect-cost-model=dynamic是一种用于控制矢量化的优化选项,它会根据环境和代码的特征动态地调整矢量化的代价,从而提高程序性能。 -fbranch-target-load-optimize2是一种用于控制分支预测的优化选项,它会尝试更好地推测分支的结果,从而提高程序性能。 -fno-gcse-after-reload是一种禁用基于重新加载的全局代码搜索和优化的选项,它可以有效地避免重新加载过程中可能存在的低效性能问题。 -fno-live-range-shrinkage是一种禁用范围缩小的优化选项,它可以有效地避免过度缩小变量的使用范围,从而提高程序性能。 -fsched-spec-load是一种指定加载器的优化选项,它会根据给定的参数对载入器进行优化,从而提高程序性能。 -ftree-loop-distribute-patterns是一种用于优化循环体的选项,它会根据循环体的模式进行优化,从而降低程序运行时间。 -funswitch-loops是一种用于控制循环展开的优化选项,它会尝试优化循环展开,以减少编译时间。 -fsimd-cost-model=unlimited是一种用于控制SIMD的优化选项,它会尝试在程序中使用SIMD指令来提高程序性能,并且不限制SIMD指令的使用数量。 -fno-associative-math是一种禁用关联运算的优化选项,它可以有效地避免在程序中使用关联运算,从而提高程序性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值