C++性能优化笔记-7-编译器中的优化-2-不同编译器的对比

^Moon^

已于 2023-11-03 16:41:31 修改

阅读量540

点赞数 1

分类专栏：架构与开发技巧程序优化 c++ 文章标签： c++ 编译器性能优化

于 2021-09-11 17:14:08 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yelede2009/article/details/120228206

版权

c++ 同时被 3 个专栏收录

59 篇文章 4 订阅

订阅专栏

架构与开发技巧

24 篇文章 6 订阅

订阅专栏

20 篇文章 1 订阅

订阅专栏

编译器中的优化

不同编译器的对比

不同编译器的对比

下表对比了不同的编译器的优化效果。
必须强调的是，编译器在不同的测试例子上可能表现不同。下表仅供参考。

优化方法	Gnu	Clang	Microsoft	Intel
通用优化
函数内联	x	x	x	x
常量折叠	x	x	x	x
常量传播	x	x	x	x
循环的常量传播	x	x	-	-
指针消除	x	x	x	x
公共子表达式消除	x	x	x	x
寄存器变量	x	x	x	x
Fused multiply and add	x	x	x	x
生命周期分析	x	x	x	x
合并相同的分支	x	x	x	x
消除跳转	x	x	x	x
尾调用	x	x	x	x
移除总为false的分支	x	x	x	x
循环展开，数组循环	x	x	x	x
循环展开，结构体	x	x	x	-
相同循环体代码移动	x	x	x	x
数组元素的归纳变量	x	x	x	x
整数表达式的归纳变量	-	x	1	x
浮点表达式的归纳变量	-	-	-	x
乘法累加器，整数	-	x	x	-
乘法累加器，浮点	-	x	x	-
去虚拟化	x	x	x	x
Profile-guided optimization	x	x	x	x
全局程序优化	x	x	x	x

整数代数化简
a+b = b+a, ab = ba (交换律)	x	x	x	x
(a+b)+c = a+(b+c), (ab)c = a(bc) (结合律)	-	x	x	-
ab + ac = a*(b+c)(分配律)	x	x	x	x
a+b+c+d = (a+b)+(c+d) (提高并行)	-	-	-	x
abcd = (ab)(cd) (提高并行)	-	x	-	x
xxxxxxx*x = (((x²)²)²)	x	x	-	x
a+a+a+a = a*4	x	x	x	x
axxx + bxx + cx + d = ((ax+b)x+c)*x + d	x	x	x	x
-(-a) = a	x	x	x	x
a-(-b) = a+b	x	x	x	x
a-a = 0	x	x	x	x
a+0 = a	x	x	x	x
a*0 = 0	x	x	x	x
a*1 = a	x	x	x	x
(-a)(-b) = ab	x	x	x	x
a/a = 1	x	x	x	-
a/1 = a	x	x	x	x
0/a = 0	x	x	x	-
乘以常量= 移位和加法	x	x	x	x
除以常量 = 乘法和移位	x	x	x	x
除以2的次幂 = 移位	x	x	x	x
(-a == -b) = (a == b)	x	x	x	-
(a+c == b+c) = (a==b)	-	x	x	x
!(a < b) = (a >= b)	x	x	x	x
(a<b && b<c && a<c) == (a<b && b<c)	x	-	-	-

浮点代数化简
a+b = b+a, ab = ba (交换律)	x	x	x	x
(a+b)+c = a+(b+c)(结合律)	x	x	-	x
,(ab)c = a(bc) (结合律)	x	x	-	-
ab + ac = a*(b+c)(分配律)	x	x	x	x
a+b+c+d = (a+b)+(c+d), abcd = (ab)(cd)	x	x	-	-
axxx + bxx + cx + d = ((ax+b)x+c)*x + d	x	x	x	x
xxxxxxx*x = (((x²)²)²)	x	x	-	-
a+a+a+a = a*4	x	x	x	-
-(-a) = a	x	x	x	x
a-(-b) = a+b	x	x	x	x
a-a = 0	x	x	x	x
a+0 = a	x	x	x	x
a*0 = 0	x	x	x	x
a*1 = a	x	x	x	x
(-a)(-b) = ab	x	x	x	x
a/a = 1	x	x	-	-
a/1 = a	x	x	x	x
0/a = 0	x	x	x	-
(-a == -b) = (a == b)	x	x	-	-
(-a > -b) = (a < b)	x	x	x	-
除以常量 = 乘以倒数	x	x	x	x

布尔代数化简
没有分支的布尔操作	x	x	-	极少
a && b = b && a, a\|\|b = b\|\|a (交换律)	x	x	-	x
a && b && c = a && (b && c) (结合律)	-	-	-	x
(a&&b)\|\|(a&&c) = a&&(b\|\|c) (分配律)	x	x	-	-
(a\|\|b)&&(a\|\|c) = a\|\|(b&&c) (分配律)	x	x	-	-
!(!a) = a	x	x	x	x
!a && !b = !(a \|\| b) (德摩根定律)	x	x	-	-
a && !a = false, a \|\| !a = true	x	x	x	x
a && true = a, a \|\| false = a	x	x	x	x
a && false = false, a \|\| true = true	x	x	x	x
a && a = a	x	x	x	x
(a&&b) \|\| (a&&!b) = a	x	-	x	x
(a&&b) \|\| (!a&&c) = a ? b : c	-	x	-	-
(a&&b) \|\| (!a&&c) \|\| (b&&c) = a ? b : c	x	-	x	x
(a&&b) \|\| (a&&b&&c) = a&&b	x	x	x	x
(a&&!b) \|\| (!a&&b) = a XOR b	x	x	-	-

向量寄存器中的位操作代数化简：
a & b = b & a, a\|b = b\|a (交换律)	x	x	-	-
a & b & c = a & (b & c) (结合律)	x	x	-	-
(a&b)\|(a&c) = a&(b\|c) (分配律)	x	x	-	-
(a\|b)&(a\|c) = a\|(b&c) (分配律)	x	x	-	-
三值逻辑指令	-	-	-	x
₍a) = a	x	x	-	-
~a & ~b = ~(a \| b)	x	x	-	-
a & ~a = false, a \| ~a = true	x	x	-	-
a & true = a, a \| false = a	x	x	-	-
a & false = false	x	x	x	x
, a \| true = true	x	x	x	-
a & a = a, a \| a = a	x	x	-	x
(a&b) \| (a&~b) = a	x	x	-	-
(a&b) \| (~a&c) = a ? b : c	x	-	-	-
(a&b) \| (~a&c) \| (b&c) = a ? b : c	-	-	-	-
(a&b) \| (a&b&c) = a&b	x	x	-	-
(a&&~b) \| (~a&b) = a ^ b	x	x	-	-
~a ^ ~b = a ^ b	x	x	-	-
a <<b<<c = a<<(b+c)	-	-	-	-

整数向量代数化简：
a+b = b+a, ab = ba (交换律)	x	x	-	-
(a+b)+c = a+(b+c), (ab)c = a(bc) (结合律)	x	x	-	-
ab + ac = a*(b+c)(分配律)	x	x	-	-
a+b+c+d = (a+b)+(c+d)	-	-	-	-
xxxxxxx*x = (((x²)²)²)	x	x	-	-
a+a+a+a = a*4	-	x	-	-
axxx + bxx + cx + d = ((ax+b)x+c)*x + d	x	x	-	-
-(-a) = a	x	x	-	-
a-(-b) = a+b	x	x	-	-
a-a = 0	x	x	-	x
a+0 = a	x	x	-	-
a*0 = 0	x	x	-	x
a*1 = a	x	x	-	-
(-a)(-b) = ab	x	x	-	-
乘以2的次幂 = 移位	x	x	x	x
(-a == -b) = (a == b)	-	x	-	-
(a+c == b+c) = (a == b)	-	x	-	-
!(a < b) = (a >= b)	-	-	-	-
(a<b && b<c && a<c) == (a<b && b<c)	-	-	-	-

浮点向量代数化简：
a+b = b+a, ab = ba (交换律)	x	x	-	x
(a+b)+c = a+(b+c), (ab)c = a(bc)(结合律)	x	x	-	-
ab + ac = a*(b+c)(分配律)	x	x	-	-
a+b+c+d = (a+b)+(c+d)	-	-	-	-
xxxxxxx*x = (((x²)²)²)	x	x	-	-
a+a+a+a = a*4	-	x	-	2*a+a+a
axxx + bxx + cx + d = ((ax+b)x+c)*x + d	x	x	-	x
-(-a) = a	x	x	-	-
a-(-b) = a+b	-	-	-	-
a-a = 0	x	x	-	x
a+0 = a	x	x	x	x
a*0 = 0	x	x	-	x
a*1 = a	x	x	-	x
(-a)(-b) = ab	-	-	-	-
a/a = 1	x	x	-	-
a/1 = a	-	x	-	-
0/a = 0	x	x	-	-
除以常量 = 乘以倒数	-	-	-	-
(-a == -b) = (a == b)	-	-	-	-
!(a < b) = (a >= b)	-	-	-	-

通用向量优化：
自动向量化	x	x	256bit	x
合并广播到指令	-	x	-	x
merge blend into masked instruction	x	x	-	x
merge conditional zero into masked instruction	x	-	-	x
合并布尔AND到掩码比较	x	x	-	x
消除所有为true的掩码	x	x	x	x
消除所有为false的掩码	x	x	-	x
表8.1. 不同C++编译器里优化的比较

测试在打开所有相关优化选项时编译在64-bit Windows下的测试代码，包括放宽浮点精度。测试了以下编译器版本：
Gnu C++ v.7.4.0 (2019, Cygwin64).
Clang C++ v.5.0.1(2019, Cygwin64).
Microsoft C++ Compiler v.19.21.27702 (Visual Studio 2019).
Intel C++ Compiler v.19.0.4.245 for Intel64, 2019.

Clang和Gnu编译器是在测试中表现最好的；Microsoft编译器在向量方面表现普通。在自动向量化方面，当前的Microsoft编译器使用256-bit向量而不是512-bit向量。Intel编译器自动使用512-bit向量，但需要指定/Qopt-zmm-usage:high。
Clang编译器倾向于过多的展开循环。过多的循环展开会减慢性能，因为它会填满CPU中的微指令缓存或回环缓冲。

欢迎交流
在这里插入图片描述

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
C++性能优化笔记-7-编译器中的优化-2-不同编译器的对比

编译器中的优化不同编译器的对比不同编译器的对比下表对比了不同的编译器的优化效果。必须强调的是，编译器在不同的测试例子上可能表现不同。下表仅供参考。优化方法GnuClangMicrosoftIntel通用优化函数内联xxxx常量折叠xxxx常量传播xxxx循环的常量传播xx--指针消除xxxx公共子表达式消除xxxx寄存器变量xxxxFused multiply a
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。