g++的思考

最新推荐文章于 2021-10-07 19:23:22 发布

Cceking

最新推荐文章于 2021-10-07 19:23:22 发布

阅读量469

点赞数

分类专栏： c++ 文章标签： g++ c++

本文链接：https://blog.csdn.net/cceking/article/details/73498285

版权

c++ 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

这几天在看数据库原理时，提到了查询优化，不禁联想到编译器的优化是怎样的？

就比如在汇编中，一般a/2可以通过逻辑右移就得出结果的，这算是优化，不用经过算术指令老老实实地除。
在这情况下，(a+b)/2明显比a/2+b/2更快，那后者在编译器会优化为前者吗？这就是mark的原因。

反汇编

先来看a/2+b/2，反汇编后，去掉相关的栈操作（子程序eip进出栈），主要显示

0x08048583 <+6>: movl $0x3e8,-0xc(%ebp)
0x0804858a <+13>: movl $0x5dc,-0x8(%ebp)
0x08048591 <+20>: mov -0xc(%ebp),%eax
0x08048594 <+23>: mov %eax,%edx
0x08048596 <+25>: shr $0x1f,%edx
0x08048599 <+28>: add %edx,%eax
0x0804859b <+30>: sar %eax
0x0804859d <+32>: mov %eax,%edx
0x0804859f <+34>: mov -0x8(%ebp),%eax
0x080485a2 <+37>: mov %eax,%ecx
0x080485a4 <+39>: shr $0x1f,%ecx
0x080485a7 <+42>: add %ecx,%eax
0x080485a9 <+44>: sar %eax
0x080485ab <+46>: add %edx,%eax

而(a+b)/2，反汇编后，主要显示

0x08048583 <+6>: movl $0x3e8,-0xc(\%ebp)
0x0804858a <+13>: movl $0x5dc,-0x8(%ebp)
0x08048591 <+20>: mov -0x8(%ebp),%eax
0x08048594 <+23>: mov -0xc(%ebp),%edx
0x08048597 <+26>: add %edx,%eax
0x08048599 <+28>: mov %eax,%edx
0x0804859b <+30>: shr $0x1f,%edx
0x0804859e <+33>: add %edx,%eax
0x080485a0 <+35>: sar %eax

差不多的原理，先将局部变量入栈，然后从栈中取参进行操作，但很明显看出两者的不同，前者多了一次 /2 操作。

0x080485a2 <+37>: mov %eax,%ecx
0x080485a4 <+39>: shr $0x1f,%ecx
0x080485a7 <+42>: add %ecx,%eax
0x080485a9 <+44>: sar %eax

可见编译器并没有优化这类语句。可能因为两者不同。
(a+b)/2的确节省一次操作，节省了时间，但比a/2+b/2溢出的可能性要大，主要取决于a和b的值了，非编译器之功了。

同样a、b交换，可以

t=a;
a=b;
b=t;

也可以

a=b^b;
b=a^b;
a=a^b;

实际就是mov和xor的差异
t=a;的汇编代码

0x080485c1 <+20>: mov -0xc(%ebp),%eax
0x080485c4 <+23>: mov %eax,-0x4(%ebp)

和
b=a^b;的汇编代码

0x080485d9 <+44>: mov -0xc(%ebp),%eax
0x080485dc <+47>: xor %eax,-0x8(%ebp)

编译器可以转化循环、条件语句和递归函数、消除整块代码和利用目标指令集的优势让代码变得高效而简洁。

这才是编译器能做的。

mark，进一步了解可以参考：
有关整数除法的优化
 关于VS编译器的优化例子（里面的例子在g++试过，汇编是不一样的）
关于软件源代码编译（就是make install那一套）

Cceking

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
g++的思考

这几天在看数据库原理时，提到了查询优化，不禁联想到编译器的优化是怎样的？就比如在汇编中，一般a/2可以通过逻辑右移就得出结果的，这算是优化，不用经过算术指令老老实实地除。在这情况下，(a+b)/2明显比a/2+b/2更快，那后者在编译器会优化为前者吗？这就是mark的原因。反汇编先来看a/2+b/2，反汇编后，去掉相关的栈操作（子程序eip进出栈），主要显示 0x08048583 <+6>:
复制链接

扫一扫