一、汇编
- C语言中低位转高位,先转大小再转类型
- 有符号数使用带符号扩展,即高位补符号位
- 无符号数使用零扩展,高位补0
- 进行数据转换时,高位类型转地位类型(如 int 转 char),先加载高位到寄存器,然后读低位字节
- 指针存储在寄存器中,解指针相当于使用寄存器间接寻址
- 移位操作时特别的,操作数1是偏移量,操作数二是要移动的数,其中偏移量是立即数或者从寄存器%cl中取出的,%cl占8位,因此偏移量最大是255
- C中循环、switch等语句都是依靠比较以及跳转实现的
二、过程
- 过程:用一组指定的参数和一个可选的返回值实现某种功能
- 过程的实现需要汇编提供:传递控制,传递数据,分配和释放内存
- 传递控制:在调用一个过程前,PC必须设置为该过程的起始地址,返回时必须恢复PC为调用该过程的语句的下一条语句
- 传递数据:调用过程时需要传递参数,过程需要返回一个返回值
- 分配和释放内存:需要为过程分配局部变量的空间,过程返回时需要回收这些空间
- x86用于参数传递的寄存器按顺序为:
%rdi、%rsi、%rdx、%rcx、%r8、%r9
- 函数超出6个参数的部分需要使用栈来传递,且参数需要向8的倍数对齐
- 返回值放在
%rax
- 寄存器是所有函数都共享的资源,为了防止被调用函数执行时不会覆盖掉调用函数所使用的寄存器,x86指定了统一的规范,即寄存器
%rbx,%rbp,%r12至%r15
被划分为被调用函数需要保存的寄存器,被调函数在执行之前需要保存这些寄存器的值,并保证在函数返回时,将这些寄存器的值恢复原来的状态 - 其他寄存器除了栈顶指针寄存器
%rsp
,都是调用者保存寄存器,即当前执行的函数可以随意更改的寄存器 - 由于程序在执行时是可以直接使用%rsp进行寻址的,因此理论上可以通过栈顶指针访问整个内存,由此引发缓冲区溢出异常,即程序修改了不应该修改的内存中的内容
- 解决方案:
- 栈随机化:栈的位置在每次运行时都随机分配
- 栈破坏检测:加入金丝雀值,在恢复寄存器和返回前,判断金丝雀值是否发生了改变
- 限制可执行代码区域:即只有规定内存区域内的内容被标记为可执行的,其他内存区域只可被标记可读或者可写
- 针对浮点数,有另外一套寄存器和指令用于浮点数的存储和操作,寄存器命名为
%ymm0至%ymm15
,256位,这些寄存器都是调用者保存的,即被调用函数无需保存这些寄存器的值可以直接进行覆盖。 - 浮点数最多可以用寄存器传递8个参数,即
%ymm0到%ymm7
用于传递浮点数类型的参数