写在前面:从腾讯实习回来之后,就感觉到自己的知识体系过于散乱。于是萌生了写一个自己的操作系统这样的心思,此为系列第一章,主要是讲解一些汇编知识的,内容大多从CSAPP中也可以获得。
本篇内容主要讲解汇编指令:mov
数据传送指令 mov
在汇编中最频繁使用的指令是将数据从一个位置复制到另一个位置的指令。操作数表示的通用性使得一条简单的数据传送指令能偶完成在许多机器中要好几条不同指令才能完成的功能。
下图中给出了最简单数据传送指令mov的使用方法:
注:
就像图中描述的那样,这些指令把数据从源位置复制到目的位置,不做任何变化。而mov中四种形式:movb、movw、movl、movq除了移动的操作数大小有不同就没有任何区别了。
所以说:mov指令 = (mov + 操作数GAS后缀) 源 目的
简单介绍了一下mov的功能,那么mov所搬移的目的地或者搬移的操作数的起源又是在哪儿呢?
- 源操作数指定的是值是一个立即数,存储在寄存器或者内存中。
- 目的操作数指定一个位置,要么是一个寄存器,要么是一个内存地址
注:
x86-64对这个规矩加了一个限制:传送的指令的两个操作数不能都指向内存位置。
mov后缀确定
刚刚讲了mov指令后面需要带后缀,那么这些后缀怎么去确定呢?
博主不羁之路总结的挺好,我这里就拿来主义了🤭
不羁之路:
立即数、寄存器、内存地址,目的地址包括:寄存器和内存地址两种,所以应该有3*2=6种组合方案,由于不能出现源和目的地址都是内存地址的情况,所以只有6-1=5种可能的组合方案,我们将其归纳如下:
mov示例
下面的部分语句展示了mov语句的使用,记住第一个是源操作数,第二个是目的操作数:
movl $0x4050,%eax //根据%eax,确定大小是4字节,所以GAS后缀为l
movw %bp,%sp //目的%sp寄存器是16位的,所以用双字w
movb (%rdi,%rcx),%al //可以看到目的寄存器是8位的%al,所以后缀位b
movb $-17, (%rsp) //这个是将-17放入内存地址,所以根据立即数大小确定后缀b
movq %rax, -12(%rbp) //这里寄存器%rax是64位的,所以确定后缀为q
mov的数据扩展
刚刚我们说了mov的后缀确定,但是有个问题大家想过么,刚刚表格里面提到的以下命令是做什么的,什么又叫做绝对的四字?
movabsq I,R
常规的movq
指令只能以表示为32位补码数字的立即数作为源操作数,然后把这个值符号扩展得到64位的值,放到目的位置。而movabsq
指令能够以任意64位数值作为源操作数,并且只能以寄存器作为目的。
下面两个表格做的事情就是在将较小的源复制到较大的目的时需要使用。所以这些指令都把数据从源复制到目的寄存器。
首先是movz
类,这个类叫做零扩展传送,它会把目的中剩余字节填充成0。比如说以下命令:
movzbw $0x8 %sp
这个指令在寄存器%sp
中就会发生以下情况:
另外一个就是符号扩展传送了,他会把源操作的最高位进行复制。比如说以下两个命令:
movsbw $0x8 %sp
movsbw $0x-8 %sp
mov 练习题
还是一样,觉得自己能了可以先做以下这个CSAPP后面的练习题,往后翻就是答案和详解:
mov 练习题答案
压入和弹出数据
熟悉操作系统的都知道每个进程都有一个栈,通过汇编指令push
我们可以把数据压入栈;通过汇编指令pop
我们可以把数据弹出栈。
而这两个指令都只有一个操作数——压入的数据源或弹出数据的目的。
我们之前也提到了,程序的栈指针%rsp
永远保存着栈顶的地址,而对于程序压栈的这个过程,首先要做的就是将%rsp
寄存器的值减8,之后我们将新值写入程序站,此时栈内情况:
而这个过程用到的指令则是简单的一句:
pushq %rbp //%rbp元素压栈
//等价于 -- >
subq $8 %rsp //%rsp栈指针减8,开辟栈空间
movq %rbp,(%rsp) //将%rbp中的元素压入栈顶
而弹出一个四字操作则是从栈顶位置读出数据,然后将栈顶指针%rsp
加8。此过程的图示如下:
这个过程会用到以下汇编指令:
popq %rax //元素出栈至%rax
//等价于 -- >
movq (%rsp),%rax //栈顶元素放入%rax
addq $8,%rsp //%rsp-8,释放栈空间
参考文献
[1] 深入理解计算机系统 第三章 程序的机器级表示