c调用system curl_Linux系统调用原理

最新推荐文章于 2023-10-09 16:20:06 发布

weixin_39761422

最新推荐文章于 2023-10-09 16:20:06 发布

阅读量145

点赞数

文章标签： c调用system curl linux system函数 linux内核编译及添加系统调用(hdu) linux系统 linux系统调用 linux编译内核添加系统调用

作者:songsong001

来源:微信公众号:Linux内核那些事

出处:https://mp.weixin.qq.com/s?__biz=MzA3NzYzODg1OA==&mid=2648464357&idx=1&sn=0e82ec3d4e3fb72195cfce1a55da6759

一、什么是系统调用

系统调用跟用户自定义函数一样也是一个函数，不同的是系统调用运行在内核态，而用户自定义函数运行在用户态。由于某些指令(如设置时钟、关闭/打开中断和I/O操作等)只能运行在内核态，所以操作系统必须提供一种能够进入内核态的方式，系统调用就是这样的一种机制。

系统调用是 Linux 内核提供的一段代码(函数)，其实现了一些特定的功能，用户可以通过 int 0x80 中断(x86 CPU)或者 syscall 指令(x64 CPU)来调用系统调用。

二、进入系统调用

本文主要介绍的是 x86 CPU 进入系统调用的方式

Linux 提供了 int 0x80 中断来让用户程序进入系统调用，我们来看看 Linux 对 int 0x80 中断的处理初始化过程：

void __init trap_init(void){    ...    set_system_gate(SYSCALL_VECTOR, &system_call);    ...}

系统初始化时，会在 trap_init() 函数中对 int 0x80 中断处理进行初始化，设置其中断处理过程入口为 system_call 。 system_call 是一段由汇编语言编写的代码，我们看看关键部分，如下：

ENTRY(system_call)    ...    call *SYMBOL_NAME(sys_call_table)(,%eax,4)    movl %eax,EAX(%esp)     # save the return value    ...

我们把上面的汇编改写成 C 代码如下：

void system_call(){    ...    // 变量 eax 代表 eax 寄存器的值    syscall = sys_call_table[eax];    eax = syscall();    ...}

sys_call_table 变量是一个数组，数组的每一个元素代表一个系统调用的入口，其定义如下(在文件 arch/i386/kernel/entry.S 中)：

.dataENTRY(sys_call_table)    .long SYMBOL_NAME(sys_ni_syscall)    .long SYMBOL_NAME(sys_exit)    .long SYMBOL_NAME(sys_fork)    .long SYMBOL_NAME(sys_read)    .long SYMBOL_NAME(sys_write)    .long SYMBOL_NAME(sys_open)    .long SYMBOL_NAME(sys_close)    ...

翻译成 C 代码如下：

long sys_call_table[] = {   sys_ni_syscall,   sys_exit,   sys_fork,   sys_read,   sys_write,   sys_open,   sys_close,   ...};

用户调用系统调用时，通过向 eax 寄存器写入要调用的系统调用编号，这个编号就是 sys_call_table 数组的下标。 system_call 过程获取 eax 寄存器的值，然后通过 eax 寄存器的值找到要调用的系统调用入口，并且进行调用。调用完成后，系统调用会把返回值保存到 eax 寄存器中。

原理如下图(图片来源 https://developer.ibm.com/zh/technologies/linux/tutorials/l-system-calls/ )：

三、系统调用实现

当用户要调用系统调用时，需要通过向 eax 寄存器写入要调用的系统调用编号。因为用户态和内核态使用的栈不同，而调用系统调用是在用户态调用的，而进入系统调用后会变成内核态，所以参数就不能通过栈来传递。Linux 使用寄存器来传递参数，参数与寄存器的关系如下：

第1个参数放置在 ebx 寄存器。
第2个参数放置在 ecx 寄存器。
第3个参数放置在 edx 寄存器。
第4个参数放置在 esi 寄存器。
第5个参数放置在 edi 寄存器。
第6个参数放置在 ebp 寄存器。

而 Linux 进入中断处理程序时，会把这些寄存器的值保存到内核栈中，这样系统调用就能通过内核栈来获取到参数。

下面我们通过 sys_open() 系统调用来说明一下系统调用的运作方式， sys_open() 实现如下：

asmlinkage long sys_open(const char *filename, int flags, int mode){    ...}

一般系统调用都需要使用 asmlinkage 编译选项， asmlinkage 编译选项是告诉编译器从栈中读取参数，其实际是封装了 GCC 的编译选项，如下：

#define asmlinkage CPP_ASMLINKAGE __attribute__((regparm(0)))

__attribute__((regparm(0))) 就是告诉 GCC 所有参数都从栈中读取，而 Linux 进入中断处理上下文时，会把 ebx 、 ecx 、 edx 、 esi 、 edi 、 ebp 寄存器的值保存到内核栈中，那么系统调用就可以从内核栈获取到参数的值。

但由于寄存器只能传递 32 位的整型值(x86 CPU)，所以参数一般只能传递指针或者整型的数值，如果要获取指针对应结构的数据，就必须通过从用户空间复制到内核空间，如 sys_open() 系统调用获取要打开的文件路径：

asmlinkage long sys_open(const char *filename, int flags, int mode){    char * tmp;    ...    tmp = getname(filename);    ...}

getname() 函数就是用于从用户空间复制数据到内核空间。

作者:songsong001

来源:微信公众号:Linux内核那些事

出处:https://mp.weixin.qq.com/s?__biz=MzA3NzYzODg1OA==&mid=2648464357&idx=1&sn=0e82ec3d4e3fb72195cfce1a55da6759

weixin_39761422

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
c调用system curl_Linux系统调用原理

作者:songsong001 来源:微信公众号:Linux内核那些事出处:https://mp.weixin.qq.com/s?__biz=MzA3NzYzODg1OA==&mid=2648464357&idx=1&sn=0e82ec3d4e3fb72195cfce1a55da6759一、什么是系统调用系统调用跟用户自定义函数一样也是一个函数，不同的是系统调用运行在内...
复制链接

扫一扫