主要介绍Linux系统调用的规则和实现方法。
1 与内核通信
系统调用在用户空间进程和硬件设备之间添加一个中间层,其作用有:
- 为用户空间提供了一种硬件的抽象接口
- 系统调用保证系统的稳定和安全
在Linux中,系统调用是用户空间访问内核的唯一手段,也是除异常和陷入外,内核唯一的合法入口。
2 API、POSIX 和 C 库
一般情况,应用程序通过API而不是直接通过系统调用编程。
而最流行的应用编程接口是基于POSIX标准,是由IEEE的一组标准组成,目标是提供一套大体上基于Unix的可移植操作系统标准。
而系统调用作为C库的一部分提供。
3 系统调用
系统调用通常通过C库中定义的函数调用来进行。
如何定义系统调用?举个get_pid系统调用的例子
asmlinkage long sys_getpid(void)
首先,asmlinkage是一个编译指令,通知编译器仅从栈中提取该函数的参数。(系统调用必须有这个限定词)
其次,函数返回long。系统调用在用户空间(int)和内核空间(long)有不同返回类型。
最后,系统调用get_pid()在内核中被定义成sys_getpid(),这是linux所有系统调用遵守的命名规则,比如bar()在内核中实现为sys_bar()函数
系统调用号
Linux中,系统调用与一个独一无二的系统调用号关联,这样只需要系统调用号,就能指明是要执行哪个系统调用。
系统调用号一旦分配不会再变更。即使一个系统调用被删除,其占用的系统调用号也不允许被回收。
sys_call_table中记录了所有已注册过的系统调用的列表。
性能
**很快!**因为很短的上下文切换时间和系统调用处理程序和系统调用本身都很简洁。
4 系统调用处理程序
用户空间的程序不能直接执行内核代码,需要以某种方式通知系统内核需要执行一个系统调用。
如何通知??其实是用一种软中断方式:通过引发一个异常促使系统切换到内核态去执行异常处理程序(系统调用处理程序)。
在x86系统上预定义的软中断是中断号128
,通过int $0x80
指令触发该中断。第128号异常处理程序就是系统调用处理程序 system_call()
。而x86处理器增加了一条叫 sysenter
的指令,比 int 更快、更专业的陷入内核执行系统调用。
指定恰当的系统调用
仅陷入内核是不够的,还需要把系统调用号一并传给内核。x86上,系统调用号通过eax寄存器传给内核。
参数传递
除了系统调用号外,大部分系统调用还需要一些外部参数,将其存放在一些寄存器中:
- 前5个参数通过ebx, ecx, edx, esi, edi顺序存放,
- 6个及6个以上参数应用一个单独的寄存器存放指向所有这些参数在用户空间地址的指针。
- 而给用户空间的返回值存放在eax寄存器中
5 系统调用的实现
实现新的系统调用
- 首先决定它的用途,每个系统调用应有其明确的用途
- 确定新系统调用的参数、返回值和错误码
- 设计接口的时候需尽量为将来做考虑
参数验证
系统调用需要检查参数是否合法有效。
最重要的一种检查是检查用户提供的指针是否有效。
6 系统调用上下文
内核在执行系统调用时处于进程上下文
绑定一个系统调用的最后步骤
- 在系统调用表的最后加入一个表项
- 把系统调用号定义在 <asm/unistd.h> 中
- 系统调用必须被编译进内核映像,只要把它放进kernel/下的一个相关文件中即可。