C++编译优化的几个例子

程序员一般都喜欢谈论编程技巧,尤其是能优化程序效率的技巧,C++程序员都不例外。但很多广泛流传的技巧都是基于一个假设,就是编译器非常愚蠢。但事实上刚好相反,现在的编译器其实非常聪明。不信的话你看下面的例子。

test函数的作用是返回从1加到100的值,大家都知道结果是5050。使用gcc编译器将其编译成汇编:
gcc -O2 -S test.c
vi test.s

生成的汇编:
test:
  pushl %ebp
  movl  $5050, %eax
  movl  %esp, %ebp
  popl  %ebp
  Ret

编译器也已经知道答案5050,所以当你调用test函数时直接返回5050而不需计算。怎么样,编译器还不笨吧?
下面看看几个常见的C++语句的编译优化。为简单起见,以下讨论都基于gcc优化编译。

(1)  i++和++i

有些人说不要用i++而要用++i,因为i++要先保存原来的值会比较慢(据说有些书是这么说的)。但事实上作为一条语句使用时(而不是作为表达式嵌入到语句中),无论i++、++i、i+=1或i=i+1编译后都只使用一条指令(INC或ADD),效果是一样的。当然作为表达式嵌入到语句中时会不一样,但这时候i++和++i一般都不能混用。
C++代码:

汇编代码:
movl  8(%ebp), %ebx
movl  12(%ebp), %ecx
movl  16(%ebp), %edx
movl  20(%ebp), %eax
addl  $1, (%ebx)
addl  $1, (%ecx)
addl  $1, (%edx)
addl  $1, (%eax)

(2) 循环内声明变量

函数局部变量使用的栈空间是在进入函数时一次分配的,而不是在声明时分配,因此在循环里声明变量并不会导致性能下降。

汇编代码:
movl  $10, %ebx
subl  $272, %esp            #分配272字节栈空间
leal  -264(%ebp), %esi       #取buf地址
.L2:
movl  %esi, (%esp)          #buf地址入栈
call  test2                  #调用test2
subl  $1, %ebx
jne .L2                     #循环未结束则跳到L2

(3) 乘2和除2

a*2被编译成a+a;无符号数a/2被编译成a>>1;有符号数a/2没看懂,但不是除运算。

 

(4) memset函数

memset函数常用来初始化大段内存,但对小数据来说memset能否保持足够高效呢?
看这段程序:

编译成汇编:
movl  $0, -24(%ebp)         #设置s1
movl  $0, -20(%ebp)
movl  $0, -16(%ebp)
movl  $0, -12(%ebp)
call  test2                  #调用test2
leal  -8216(%ebp), %edx      #设置s2
xorl  %eax, %eax
movl  %edx, %edi
movl  $2048, %ecx
rep stosl
movl  %edx, (%esp)      #调用test2
call  test2
movl  %ebx, (%esp)      #设置s3
movl  $8193, 8(%esp)
movl  $0, 4(%esp)
call  memset
movl  %ebx, (%esp)      #调用test2
call  test2

当数据长度比较小时(如s1是16字节),memset被编译成连续的赋值语句;当数据长度不大于8KB时(如s2),memset用串操作指令来实现;当数据长度大于8KB时(如s3),memset被编译成函数调用。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值