这几天在看数据库原理时,提到了查询优化,不禁联想到编译器的优化是怎样的?
就比如在汇编中,一般a/2可以通过逻辑右移就得出结果的,这算是优化,不用经过算术指令老老实实地除。
在这情况下,(a+b)/2明显比a/2+b/2更快,那后者在编译器会优化为前者吗?这就是mark的原因。
反汇编
先来看a/2+b/2,反汇编后,去掉相关的栈操作(子程序eip进出栈),主要显示
0x08048583 <+6>: movl $0x3e8,-0xc(%ebp)
0x0804858a <+13>: movl $0x5dc,-0x8(%ebp)
0x08048591 <+20>: mov -0xc(%ebp),%eax
0x08048594 <+23>: mov %eax,%edx
0x08048596 <+25>: shr $0x1f,%edx
0x08048599 <+28>: add %edx,%eax
0x0804859b <+30>: sar %eax
0x0804859d <+32>: mov %eax,%edx
0x0804859f <+34>: mov -0x8(%ebp),%eax
0x080485a2 <+37>: mov %eax,%ecx
0x080485a4 <+39>: shr $0x1f,%ecx
0x080485a7 <+42>: add %ecx,%eax
0x080485a9 <+44>: sar %eax
0x080485ab <+46>: add %edx,%eax
而(a+b)/2,反汇编后,主要显示
0x08048583 <+6>: movl $0x3e8,-0xc(\%ebp)
0x0804858a <+13>: movl $0x5dc,-0x8(%ebp)
0x08048591 <+20>: mov -0x8(%ebp),%eax
0x08048594 <+23>: mov -0xc(%ebp),%edx
0x08048597 <+26>: add %edx,%eax
0x08048599 <+28>: mov %eax,%edx
0x0804859b <+30>: shr $0x1f,%edx
0x0804859e <+33>: add %edx,%eax
0x080485a0 <+35>: sar %eax
差不多的原理,先将局部变量入栈,然后从栈中取参进行操作,但很明显看出两者的不同,前者多了一次 /2 操作。
0x080485a2 <+37>: mov %eax,%ecx
0x080485a4 <+39>: shr $0x1f,%ecx
0x080485a7 <+42>: add %ecx,%eax
0x080485a9 <+44>: sar %eax
可见编译器并没有优化这类语句。可能因为两者不同。
(a+b)/2的确节省一次操作,节省了时间,但比a/2+b/2溢出的可能性要大,主要取决于a和b的值了,非编译器之功了。
同样a、b交换,可以
t=a;
a=b;
b=t;
也可以
a=b^b;
b=a^b;
a=a^b;
实际就是mov和xor的差异
t=a;
的汇编代码
0x080485c1 <+20>: mov -0xc(%ebp),%eax
0x080485c4 <+23>: mov %eax,-0x4(%ebp)
和
b=a^b;
的汇编代码
0x080485d9 <+44>: mov -0xc(%ebp),%eax
0x080485dc <+47>: xor %eax,-0x8(%ebp)
编译器可以转化循环、条件语句和递归函数、消除整块代码和利用目标指令集的优势让代码变得高效而简洁。
这才是编译器能做的。
mark,进一步了解可以参考:
有关整数除法的优化
关于VS编译器的优化例子(里面的例子在g++试过,汇编是不一样的)
关于软件源代码编译(就是make install那一套)