C++编译优化的几个例子

最新推荐文章于 2024-03-22 17:35:48 发布

zzm_guitar

最新推荐文章于 2024-03-22 17:35:48 发布

阅读量533

点赞数

文章标签：优化 c++ 编译器汇编 gcc 编程

本文链接：https://blog.csdn.net/zzm_guitar/article/details/6227034

版权

程序员一般都喜欢谈论编程技巧，尤其是能优化程序效率的技巧，C++程序员都不例外。但很多广泛流传的技巧都是基于一个假设，就是编译器非常愚蠢。但事实上刚好相反，现在的编译器其实非常聪明。不信的话你看下面的例子。
int test() { int result = 0; int i; for (i = 1; i <= 100; i ++) result += i; return result; }

test函数的作用是返回从1加到100的值，大家都知道结果是5050。使用gcc编译器将其编译成汇编：
gcc -O2 -S test.c
vi test.s

生成的汇编：
test:
pushl %ebp
movl $5050, %eax
movl %esp, %ebp
popl %ebp
Ret
编译器也已经知道答案5050,所以当你调用test函数时直接返回5050而不需计算。怎么样，编译器还不笨吧？
下面看看几个常见的C++语句的编译优化。为简单起见，以下讨论都基于gcc优化编译。

(1) i++和++i

有些人说不要用i++而要用++i，因为i++要先保存原来的值会比较慢（据说有些书是这么说的）。但事实上作为一条语句使用时（而不是作为表达式嵌入到语句中），无论i++、++i、i+=1或i=i+1编译后都只使用一条指令（INC或ADD），效果是一样的。当然作为表达式嵌入到语句中时会不一样，但这时候i++和++i一般都不能混用。
C++代码：
void test(int &a, int &b, int &c, int &d) { a ++; ++ b; c += 1; d = d + 1; }
汇编代码：
movl 8(%ebp), %ebx
movl 12(%ebp), %ecx
movl 16(%ebp), %edx
movl 20(%ebp), %eax
addl $1, (%ebx)
addl $1, (%ecx)
addl $1, (%edx)
addl $1, (%eax)

(2) 循环内声明变量

函数局部变量使用的栈空间是在进入函数时一次分配的，而不是在声明时分配，因此在循环里声明变量并不会导致性能下降。
void test2(char *s); void test() { int i; for (i = 0; i < 10; i ++) { char buf[256]; test2(buf); //调用test2是为了让编译器认为buf有用，以免被优化掉 } }
汇编代码：
movl $10, %ebx
subl $272, %esp            #分配272字节栈空间
leal -264(%ebp), %esi       #取buf地址
.L2:
movl %esi, (%esp)          #buf地址入栈
call test2                  #调用test2
subl $1, %ebx
jne .L2                     #循环未结束则跳到L2

(3) 乘2和除2

a*2被编译成a+a；无符号数a/2被编译成a>>1；有符号数a/2没看懂，但不是除运算。

(4) memset函数

memset函数常用来初始化大段内存，但对小数据来说memset能否保持足够高效呢？
看这段程序：
#include "string.h" void test2(char *s); void test() { char s1[16], s2[0x2000], s3[0x2001]; memset(s1, 0, sizeof(s1)); test2(s1); memset(s2, 0, sizeof(s2)); test2(s2); memset(s3, 0, sizeof(s3)); test2(s3); }
编译成汇编：
movl $0, -24(%ebp)         #设置s1
movl $0, -20(%ebp)
movl $0, -16(%ebp)
movl $0, -12(%ebp)
call test2                  #调用test2
leal -8216(%ebp), %edx      #设置s2
xorl %eax, %eax
movl %edx, %edi
movl $2048, %ecx
rep stosl
movl %edx, (%esp)      #调用test2
call test2
movl %ebx, (%esp)      #设置s3
movl $8193, 8(%esp)
movl $0, 4(%esp)
call memset
movl %ebx, (%esp)      #调用test2
call test2
当数据长度比较小时（如s1是16字节），memset被编译成连续的赋值语句；当数据长度不大于8KB时（如s2），memset用串操作指令来实现；当数据长度大于8KB时（如s3），memset被编译成函数调用。