从汇编层看64位程序运行——所见非所写（编译器的优化），别做无用代码优化

breaksoftware

已于 2024-07-19 10:47:00 修改

阅读量993

点赞数 11

分类专栏：从汇编层看64位程序运行文章标签：汇编 c++

于 2024-07-16 00:30:00 首次发布

本文链接：https://blog.csdn.net/breaksoftware/article/details/140399083

版权

从汇编层看64位程序运行专栏收录该内容

13 篇文章 2 订阅

订阅专栏

大纲

函数的输入输出
系统的输入、输出
- 系统输出
- 系统输入
总结

现代编译器都有很强大的优化能力，导致我们写的逻辑和编译结果有很大的区别，但是最终执行效果是一样的。
本文我们将通过一些例子，查看编译器是如何做出一些推理和优化的。

函数的输入输出

我们先测试函数的输入和输出是否对优化有影响

无输入、无输出

void foo() {
    int a = 10;
    a = a + 5;
}

int main() {
    foo();
    return 0;
}

低等级优化

我们使用-O0，采用低优化等级的方式编译，产生结果如下
在这里插入图片描述
可以看到-O0时，汇编层代码和C语言基本一致。

高等级优化

使用-O3，采用高等级的方式编译，产生结果如下
在这里插入图片描述
可以看到foo函数在汇编层面没有给变量a申请栈上空间，更没有将其自增5。它最终什么都没做。
main函数也没有调用foo函数，只是简单的通过eax寄存器返回0给其调用者。
这段汇编的执行结果和我们编码的最终结果是一致的，就是没有任何表现。只是过程中，我们的编码更复杂，而汇编层则更直接。

有输入，无输出

void foo1(int a) {
    a = a + 5;
}

int main() {
    int a = 10;
    foo1(a);
    return 0;
}

低等级优化

上面代码使用-O0编译，可以看到如下结果
在这里插入图片描述
可以发现其基本逻辑和C语言的编码是一致的。

高等级优化

我们再使用-O3编译
在这里插入图片描述
可以看到我们写C语言逻辑全部被优化掉了。汇编层基本就是什么都没做。这个也符合C语言逻辑的执行结果。

有输入，有输出

int foo1(int a) {
    a = a + 5;
    return a;
}
int main() {
    int a = 10;
    a = foo1(a);
    return 0;
}

我们直接看-O3等级的优化
在这里插入图片描述
这次可以看到foo1函数的翻译和C语言一致。但是main函数中没有让foo1函数的调用产生任何效果，所以在main的汇编中还是没看到对foo1的调用。

总结

我们发现函数的输入和输出对编译器的优化没有什么影响。但是最后一个例子我们发现，一个函数如果对外部产生影响，则其内部逻辑才不会被抛弃。

系统的输入、输出

既然在上面的案例中，我们发现只有对外部产生影响的逻辑才不会被优化完，那么我们就让我们的程序对接系统输入和输出，从而观察其影响。

系统输出

#include <stdio.h>
int foo1(int a) {
    a = a + 5;
    return a;
}
int main() {
    int a = 10;
    a = foo1(a);
    printf("%d", a);
    return 0;
}

foo1函数让入参自增5后返回。按理说，foo1和main函数都对外部产生了影响，那么它们的逻辑会不会如实编译成汇编逻辑呢？
我们使用-O3编译，可以看到foo1的确被如实编译。但是main函数仍然没有调用foo1函数。这是因为编译器已经提前推断出要输出的是15（0xf），于是它就将最终结果编译到二进制文件中，而不需要在运行时做计算再获得。
在这里插入图片描述
如果我们将系统输出指令放到foo1函数内部呢？这样是不是main函数就要调用foo1了呢？

#include <stdio.h>
int foo1(int a) {
    printf("%d", a);
    a = a + 5;
    return a;
}
int main() {
    int a = 10;
    a = foo1(a);
    printf("%d", a);
    return 0;
}

使用-O3编译，可以看到main函数仍然没有调用foo1。反而它的内部将foo1中的系统输出给实现了，即在main中直接输出了10，而没有通过foo1来输出。
造成这样的结果的根本原因就是编译器在编译时完全预知了程序运行结果，所以它采用最简单最直接的方式编译出汇编层的逻辑，并保证其逻辑和C语言的一致。
在这里插入图片描述

系统输入

为了让编译器不能推断出逻辑运行的最终结果，我们引入系统输入，让输出结果由我们的输入计算出。

#include <stdio.h>
int foo1(int a) {
    printf("%d", a);
    a = a + 5;
    return a;
}
int main() {
    int a = 10;
    int ret = scanf("%d", &a);
    if (ret == 0) {
        printf("Invalid input");
        return 0;
    }
    a = foo1(a);
    printf("%d", a);
    return 0;
}

我们使用-O3编译，可以看到main函数还是没有调用foo1函数。原本在foo1中的参数自增5也变成在main函数中实现（+79）了。
在这里插入图片描述

总结

编译器会按照它认为最优的方式优化代码，导致我们的C语言代码和最终编译结果在逻辑层面有非常大的差别，但是最终执行结果却是一致的。所以很多时候，我们在优化代码的时候，要深入汇编层确认后再去做，否则可能做的就是无用功，因为聪明的编译器已经帮我们优化了很多代码了。

breaksoftware

关注

11
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
从汇编层看64位程序运行——所见非所写（编译器的优化），别做无用代码优化

我们发现函数的输入和输出对编译器的优化没有什么影响。但是最后一个例子我们发现，一个函数如果对外部产生影响，则其内部逻辑才不会被抛弃。编译器会按照它认为最优的方式优化代码，导致我们的C语言代码和最终编译结果在逻辑层面有非常大的差别，但是最终执行结果却是一致的。所以很多时候，我们在优化代码的时候，要深入汇编层确认后再去做，否则可能做的就是无用功，因为聪明的编译器已经帮我们优化了很多代码了。
复制链接

扫一扫