http://blog.openrays.org/blog.php?do=showone&tid=422
系统调用是用户态进程切入内核态的唯一入口,是内核为用户态进程提供服务的接口。Linux Kernel 提供了大约300个左右的系统调用,作为用户空间进程访问内核的 API。
C 语言环境下,经常使用的系统调用(如getpid)是系统基础库 libc 封装过的,也就是系统调用的实现库是libc,在其后面究竟隐藏着什么样的秘密呢?
1. 先看一个例子:
#include <stdio.h>
int main()
{
long ID1;
ID1 = getpid();
printf("pid=%d\n", ID1);
return 0;
}
存为 sc.c,如下命令编译之:
gcc sc.c -o sc -static
看看它的汇编码:
objdump -d sc > sc.S
查看 sc.S 我们发现 getpid 被 libc 替换成 __getpid,而这个函数只有下面的 3 行指令:
0804e0d0 <__getpid>:
804e0d0: b8 14 00 00 00 mov $0x14,%eax
804e0d5: cd 80 int $0x80
804e0d7: c3 ret
将 0x14 置于 eax 后,触发 0x80 号软件中断。
这个 0x80 号软件中断服务程序,就是内核系统调用的统一入口。
至于如何区分具体的是哪个系统调用,则通过 eax 传过来的整型值来区分。内核定义了一个系统调用表,表的每项是一个函数指针,指向具体的实现函数,每个系统调用函数在表中的位置固定,其序号 (从 0 开始计数)就是该系统调用的系统调用号。实际上就是一个元素固定的数组。如 i386 内核,系统调用表名为 sys_call_table,则 sys_call_table[20] 就是 getpid 的函数指针:
[arch/i386/kernel/syscall_table.S]
ENTRY(sys_call_table)
.long sys_restart_syscall /* 0 - old "setup()" system call, used for restarting */
.long sys_exit
.long sys_fork
.long sys_read
.long sys_write
.long sys_open /* 5 */
.long sys_close
.long sys_waitpid
.long sys_creat
.long sys_link
.long sys_unlink /* 10 */
.long sys_execve
.long sys_chdir
.long sys_time
.long sys_mknod
.long sys_chmod /* 15 */
.long sys_lchown16
.long sys_ni_syscall /* old break syscall holder */
.long sys_stat
.long sys_lseek
.long sys_getpid /* 20 */
.long sys_mount
...
int 0x80 触发,使内核进入相应的处理程序,在保存了寄存器后,就使用 eax 的值索引 sys_call_table,得到地址后,跳转过去就进入了实质的服务函数。
因此,我们可以改写上面的程序为:
#include <stdio.h>
int main()
{
long ID1;
//ID1 = getpid();
asm volatile(
"int $0x80\n\t"
: "=a" (ID1) /* eax 亦是返回值所在,因此要与ID1 对应 */
: "0" (20) /* 20 置入 eax */
);
printf("pid=%d\n", ID1);
return 0;
}
编译 gcc sc.c -o sc,执行之,结果是一样的。
上面简单的系统调用不需要传递参数,当需要传递 3 个参数时,那么如何处理呢?
2. 参数传递
i386 内核实现系统调用时有一个参数传递约定:
ebx --- 置第一个参数
ecx --- 置第二个参数
edx --- 置第三个参数
esi --- 置第四个参数
edi --- 置第五个参数
ebp --- 置第六个参数 (系统调用最大参数个数为6)
特别注意,使用 ebp 前要先将其进栈, int 0x80 返回后,要恢复之。
3. 使用标准宏
上面使用嵌入式汇编不是很方便,可以使用 POSIX 标准约定的一系列宏:
#include <linux/unistd.h>
_syscallX(type, name, type1, arg1, type2, arg2, ...)
其中 X 取值 0~5 表示系统调用的参数个数
name 为系统调用的名字,如 getpid, read 等
type1 为第一个参数类型
arg1 为第一个参数值
type2 为第二个参数类型
arg2 为第二个参数值
...
很显然,使用这些宏,要对所用之系统调用的参数个数和类型有清晰的了解。
如上面的程序改写为:
#include <stdio.h>
#include <linux/unistd.h>
_syscall0(int, getpid);
int main()
{
long id = getpid();
printf("id = %d\n", id);
return 0;
}
就绕过了 libc。可以使用 gcc -E sc.c > sc.C 看看预处理后的结果,就知道这个_syscall 宏做了什么事了。
这些宏定义于内核源码目录的 include/asm-i386/unistd.h 下,抑或 /usr/include/asm-i486/unistd.h 下。
4. 查看系统调用号
可以查看内核源码目录的 include/asm-i386/unistd.h,该文件中定义了一系列以 __NR_ 开头的常量,紧随其后的即为系统调用名,相应的即为系统调用号。