(X64下的内联汇编避坑之“mov报错?”)
---- 为何32位的代码到64位软脚了?
首先我们先回顾下关于x64在C标准库中定义的一系列长度变化
以最常用的size_t为例,在64位系统下的size_t也变成了64位:
typedef long size_t;
因此,对于有些内嵌汇编教程中的movl指令就必须进行相应的变动;而具体的变动则应当参考man页中的定义进行相关的变动。
举个栗子,有如下代码段
int main(void)
{
int str_len = 15;
const char* str = "hello world!\n\r";
asm volatile(
"movl $4, %%eax\n\t"
"movl $1, %%ebx\n\t"
"movl %0, %%ecx\n\t"
"movl %1, %%edx\n\t"
"int $0x80\n\t"
:
:"r"(str), "r"(str_len)
:"eax","ebx", "ecx", "edx"
);
return 0;
}
其功能是调用系统调用write,向stdout输出hello world!, 这段代码在32位linux系统下是可以成功编译运行的;但是,如果有幸运的读者拿着这些代码去64位linux系统下编译,gcc则会报错:unsupported instruction `mov’(不被支持的mov指令!!!);
是的,很开心的遇到了一个不知所云的BUG,为何会产生呢?我们首先定位到报错的地点,即这些代表了传给write参数的指令;
那为甚么在32位下可以而64位就不行了?答案还得从地址长度出发,不同环境下参数要求的长度可能是会变的!!
查看man页可以发现
ssize_t write(int fd, const void *buf, size_t count);
细心的读者肯定发现了参数2和参数3用只4字节指令是不是会不对劲呢?明明要8byte!因此,我们只需将movl修改成movq, 相关的寄存器对应扩大即可
修改后的代码如下·:
int main(void)
{
long str_len = 15;
const char* str = "hello world!\n\r";
asm volatile(
"movl $4, %%eax\n\t"
"movl $1, %%ebx\n\t"
"movq %0, %%rcx\n\t"
"movq %1, %%rdx\n\t"
"int $0x80\n\t"
:
:"r"(str), "r"(str_len)
:"eax","ebx", "rcx", "rdx"
);
return 0;
}
再次在64位下编译即可成功了!!!
总结:这看似简单的移植其实涉及到了ABI相关的知识(不同的系统位数下,对应的地址长度不同),希望各位读者能仔细品味,避坑避雷!
enjoy it.