(注:以下内容和原理均来自《深入理解计算机系统第3版》)
当我们实现一个带有判断功能的代码时要使用到if判断语句,if语句在汇编中是如何实现的呢?我们先来看这样一个代码
absdiff.c
long absdiff(long x, long y)
{
long result;
if(x < y)
result = y-x;
else
result = x-y;
return result;
}
接着我们看看它的汇编,我们使用Og优化级别
gcc -Og -S absdiff.c
在x86-64Linux汇编如下
.file "absdiff.c"
.text
.globl absdiff
.type absdiff, @function
absdiff:
.LFB0:
.cfi_startproc
cmpq %rsi, %rdi
jl .L4
movq %rdi, %rax
subq %rsi, %rax
ret
.L4:
movq %rsi, %rax
subq %rdi, %rax
ret
.cfi_endproc
.LFE0:
.size absdiff, .-absdiff
.ident "GCC: (Ubuntu 6.3.0-12ubuntu2) 6.3.0 20170406"
.section .note.GNU-stack,"",@progbits
我们可以看到其中的实现是通过控制传送,也就是跳转来实现的,现代CPU使用多级流水线的方式工作,后面的指令不需要等待前面指令执行完成即可执行,那么CPU需要对cmpq的结果进行预测,选择一个分支执行,当预测错误时就要丢弃当前的工作,返回跳转处从新执行,这造成了CPU资源极大的浪费,CPU的预测无法保证较高的正确率,因为用户的程序是无法预知的。
接下来我们提高优化级别,改为O1级别:
gcc -O1 -S absdiff.c
汇编结果如下:
.file "absdiff.c"
.text
.globl absdiff
.type absdiff, @function
absdiff:
.LFB0:
.cfi_startproc
movq %rsi, %rdx
subq %rdi, %rdx
movq %rdi, %rax
subq %rsi, %rax
cmpq %rsi, %rdi
cmovl %rdx, %rax
ret
.cfi_endproc
.LFE0:
.size absdiff, .-absdiff
.ident "GCC: (Ubuntu 6.3.0-12ubuntu2) 6.3.0 20170406"
.section .note.GNU-stack,"",@progbits
可以看到并没有使用跳转,而是使用cmovl这个条件传送指令,这样CPU就不需要进行分支预测了,可以极大的提高性能。其实现原理可以使用如下的C语言来解释
long cmovdiff(long x, long y)
{
long rval = y-x;
long eval = x-y;
long ntest = x >= y;
/* Line below requires
* single instruction: */
if(ntest)
rval = eval;
return rval;
}
但是使用条件传送也不总是会提高代码的效率。当if中需要大量的计算时,当相对的条件不满足时,这些工作就白费了。编译器必须在浪费的计算和分支预测错误之间做出选择。在gcc中,当表达式很容易计算时才会使用条件传送。通常情况下,即使许多分支预测错误的开销会超过更复杂的计算,gcc还是会使用条件控制转移。