使用linux系统调用ABI

本篇文章是基于C和汇编的

首先采用调用0x80中断的方式进行系统调用:

void prints(char *str){
    int i = 0;
    while(str[i] != '\0'){
        i++;
    }

    asm("movl $4, %%eax \n\t"
        "movl $1, %%ebx \n\t"
        "movl %0, %%ecx \n\t"
        "movl %1, %%edx \n\t"
        "int $0x80 \n\t"
        ::"m"(str), "m"(i)
      );

    return;
}

int main(){
    char *str1  = "ab"; //字符串内容存储在堆上
    char str2[] = "ab"; //字符串内容存储在栈上
    prints(str1);  //正常显示
    prints(str2);  //不显示
}

这里的关键在于Linux系统0x80号中断是32位系统调用。其接收4个参数,寄存器ecx中的参数为要显示的内容的内存首地址,而在64位系统下用gcc编译,生成的程序默认是64位的,64位程序的内存地址(也就是C语言中的指针)是64位的,我们把内存地址传给ecx,ecx只有32位,所以地址的高32位会丢失,系统按照错误的地址去寻址,肯定找不到内容。

那么为何堆上的数据可以显示,段上的不行呢,因为Linux系统在给程序分配内存空间的时候,堆的内存位置位于低内存地址,地址虽然是64位的,但是高32位全为0;而堆栈却位于高内存地址,高32位不为零,因此只能正确寻找到堆上的数据。

0x80中断传入不正确的地址会怎样:并不会报错,没有任何提示,但是会返回一个错误码(负数),存在eax中,具体错误码可以在头文件中查看(头文件中是正数):

/usr/include/asm-generic/errno-base.h 
/usr/include/asm-generic/errno.h

通过echo $?可以看到程序返回242(0xF2),也就是-14(负数代表调用出错,绝对值是错误码;若正确调用会返回正确输出的字符数)。查看errno-base.h中定义:

#define    EFAULT        14    /* Bad address */

和上面分析的一样:传入了错误的内存地址。

实际上printf正确调用也会返回写入(标准输出)的字符数(返回值用eax寄存器传递),错误调用返回负数,这点和系统调用的返回值类似。


我们怎么修改我们的程序呢?64位程序不再用int $0x80进行系统调用,可以考虑用syscall指令,这是64位系统的ABI调用方式,系统调用号和0x80不同,参数传递的寄存器约定也不一样。
详情可以查看:http://blog.rchapman.org/posts/Linux_System_Call_Table_for_x86_64/

修改后的程序:

void prints(char *str){
    long i = 0;  //这里也可以用int,因为用int后面会编译为`movl ..., %edx`,这个语句会把edx高32位清零。
    while(str[i] != '\0'){
        i++;
    }
    asm("syscall \n\t"::"a"(1), "D"(1), "S"(str), "d"(i));
}

int main(){
    char *str = "ab\n";
    char str1[] = "cd\n";

    prints(str);
    prints(str1);
}

syscall参数寄存器约定:

系统调用功能号:rax
参数列表按顺序分别是:rdi、rsi、rdx、r10、r8、r9

普通函数参数寄存器约定:

参数列表按顺序分别是:rdi、rsi、rdx、rcx、r8、r9

展开阅读全文

没有更多推荐了,返回首页