快速入门汇编语言

最新推荐文章于 2024-10-08 16:04:22 发布

鱼儿-1226

最新推荐文章于 2024-10-08 16:04:22 发布

阅读量1.8k

点赞数 5

分类专栏： vc++ 文章标签： c++ windows

本文链接：https://blog.csdn.net/qq_21743659/article/details/127322831

版权

这篇是我在先后学习了《汇编原理》、《CSAPP》第三章和《x86 data sheet》，以及经历了大量google后写出的总结性文档，用于自查和复习。若能有所助益，不胜荣幸。如有错漏，烦请不吝赐教。

1. 从C到汇编

在初学C语言时，我们都会写一个叫做hello.c的文件，通过编译(广义)这个文件（及库文件）并执行，计算机会在屏幕上显示"Hello world!"这一行字符串。但是，我们不禁发问，计算机究竟是怎样理解hello.c中的代码的？

显然，计算机不可能直接理解这么抽象的语句，它只认识高电平和低电平，也就是二进制语言(010010...)。编译器就负责把人类写的源文件“翻译”成计算机认识的二进制文件。“翻译”的牵涉到一系列工具和复杂的过程，主要是预由预处理器把源代码中的宏去掉/替换；由编译器将源代码翻译为汇编程序（这是我们的主角）；由汇编器将汇编程序翻译为目标文件，目标文件已经是二进制文件了，但它还不能执行；链接器则将多个目标文件合为一个可执行文件。然后我们执行可执行文件时，计算机会将可执行文件中的二进制代码搬到内存，拆解为一系列的指令，CPU按照一定的顺序执行这些指令，就完成了对可执行文件的执行。如果这部分看不懂，你就需记住一句话，计算机并不直接执行源文件，而是执行编译完成后生成的可执行二进制文件。

让我以x86_64下的hello.c为例。

这是源代码

这是二进制代码（为了显示方便，用16进制代替了）

那汇编语言是什么呢？它是源代码和二进制代码之间的桥梁，它与二进制代码一一对应，同时又具备了可读性。可以说，它就是文本化的二进制代码。在发明高级语言之前，它一直是人类使用的程序语言。让我们看看hello.c对应的汇编语言是什么样子的。

汇编语言（节选）

实际上，它与二进制代码的一一对应关系很容易看出：

左边是二进制，右边是汇编

2. x86_64平台上的汇编语言

我们知道高级语言，如C语言，的编写规则与硬件平台无关。同样一份C语言文件，在x86,x86_64, arm上（可以搭载windows，macOS，linux）发挥着相同的功能，这也正是高级语言的优势之一。然而，很不幸，汇编语言是高度定制化的，同样一份源代码在不同的平台上生成的汇编代码是不同的。这是因为汇编代码其实就是一条一条的指令，然而不同的机器上的指令集体系结构是不同的。在x86_64平台上，你需要用到它提供的它自己的复杂指令集；在arm机器上，则要用到它自身的精简指令集。打个不是很恰当的比方，可以把生成可执行的二进制文件想象成为x86_64和arm分别建造房屋，然而x86_64只提供石头，arm只提供砖块。虽然最终房屋的功能都是相同的，但是它们的外貌一定是有差别的。

我在日常学习中主要用到x86_64的平台(恰如大多数人)，所以本文解决如何看懂x86_64上的汇编语言的问题。说到这儿，不得不提到x86_64平台的一些关键点。