Linux 基础
Linux 操作系统:基于 Linux 内核的操作系统。通常由 Linux 内核,shell(特殊的应用程序,提供运行其它程序的接口)、文件系统和应用程序。
常见的有:Redhat,Fedora,Centos,Ubuntu 和 Android 等。
LInux 的运行空间 = 内核空间 + 用户空间
内核空间:存放的是整个内核代码和所有内核模板,以及内核所维护的数据。
用户空间:用户程序的代码和数据。
什么是系统调用
操作系统提供给用户程序调用系统服务(硬件设备)的一组”特殊“接口。
通常,在 OS 的核心中都设置了一组用于实现各种系统功能的子程序(过程),并将它们提供给应用程序调用。由于这些程序或过程是 OS 系统本身程序模块中的一部分,为了保护操作系统程序不被用户程序破坏,一般都不允许用户程序访问操作系统的程序和数据,所以也不允许应用程序采用一般的过程调用方式来直接调用这些过程,而是向应用程序提供了一系列的系统调用命令,让应用程序通过系统调用去调用所需的系统过程。
系统调用可以被看成是一个内核与用户空间程序交互的接口:把用户进程的请求传达给内核,待内核把请求处理完毕后再将处理结果送回给用户空间。
为了保证系统程序不被应用程序有意或无意地破坏,为计算机设置了两种状态:系统态(也称为管态或核心态) 和用户态(也称为目态)。
操作系统在系统态运行,而应用程序只能在用户态运行。在实际运行过程中,处理机会在系统态和用户态间切换。相应地,现代多数操作系统将 CPU 的指令集分为特权指令和非特权指令两类。
与一般的过程调用的区别
1.运行在不同的系统状态。一般的过程调用,其调用程序和被调用程序都运行在相同的状态——系统态或用户态;而系统调用与一般调用的最大区别就在于:调用程序是运行在用户态,而被调用程序是运行在系统态。
2.状态的转换通过软中断进入。由于一般的过程调用并不涉及到系统状态的转换,可直接由调用过程转向被调用过程。但在运行系统调用时,由于调用和被调用过程是工作在不同的系统状态,因而不允许由调用过程直接转向被调用过程。通常都是通过软中断机制,先由用户态转换为系统态,经核心分析后,才能转向相应的系统调用处理子程序。
3.返回问题。在采用了抢占式(剥夺)调度方式的系统中,在被调用过程执行完后,要对系统中所有要求运行的进程做优先权分析。当调用进程仍具有最高优先级时,才返回到调用进程继续执行;否则,将引起重新调度,以便让优先权最高的进程优先执行。此时,将把调用进程放入就绪队列。
4.嵌套调用。像一般过程一样,系统调用也可以嵌套进行,即在一个被调用过程的执行期间,还可以利用系统调用命令去调用另一个系统调用。当然,每个系统对嵌套调用的深度都有一定的限制,例如最大深度为 6。但一般的过程对嵌套的深度则没有什么限制。
为什么设置系统调用
1.把用户从底层的硬件编程中解放出来
与具体的硬件完全隔离,用户不需要面向具体的硬件编码,降低了开发的复杂性和难度
2.极大的提高了系统的安全性
将用户进程隔离实现内核“保护”,用户进程不允许访问内核数据,也无法使用内核函数。用户访问内核的路径是事先规定好的,只能从规定位置进入内核,而不准许肆意跳入内核。有了这样的陷入内核的统一访问路径限制才能保证内核安全无误。
3.使用户程序具有可移植性
不同平台不同硬件
系统调用实现
软件中断:它是通过软件指令触发的中断。Linux 系统内核响应软件中断,从用户态切换到内核态,执行相应的系统调用。
系统调用控制程序执行软件中断的过程如下:
1.在进程的内核态堆栈中保存大多数寄存器的内容(即保存恢复进程到用户态执行所需要的上下文);
2.根据用户态传递的系统调用号,确定系统调用的执行程序;
3.调用相应的执行程序来处理系统调用;
4.从系统调用返回。
两个关键因素: 系统调用号,系统调用表。
系统调用号:每个系统调用被赋予一个系统调用号,与具体的系统调用相关联。
系统调用表:内核维护系统调用表,保存系统调用函数的起始地址,系统调用号对应系统调用在调用表中的偏移量。
执行系统调用的方法
1.glibc 库函数
glibc 是 Linux 下使用的开源的标准 C 库,是 GNU 发布的 libc 库,即运行时库。
Glibc 实现操作系统提供的系统服务,即系统调用的封装。
特点:
1.每个特定的系统调用对应了至少一个glibc 封装的库函数;
2.多个 API 也可能只对应同一个系统调用;
3.返回值 -1 在多数情况下表示内核不能满足进程的请求;
4.Libc 中定义的 errno 变量包含特定的出错吗。
2.syscall 直接调用
glibc 提供的 syscall 函数直接调用
函数原型:long int syscall(long int sysno, ...)
参数说明:sysno 是系统调用号,唯一标识系统调用号,详见 sys/syscall.h
… 为剩余可变长的参数,为系统调用所带的参数,根据系统调用的不同,可带 0~5
个不等的参数,如果超过特定系统调用能带的参数,多余的参数将被忽略
返回值:该函数返回值为特定系统调用的返回值,在系统调用成功后可以将该返回值转化为特定的类型,如果系统调用失败则返回 -1
,错误代码存放在 errno
中。
两种方法对比
优势 | 劣势 | |
---|---|---|
Glibc 函数库 | 只需了解 glibc 提供的 API原型,无须知道更高的细节;其次,更好的移植性 | 没有封装某个内核提供的系统调用时无法使用 |
Syscall 调用 | 可定制自己的系统调用 | 使用不便 |
如何高效执行 Linux 系统调用
频繁使用底层系统调用会影响程序的执行效率。
罪魁祸首—用户态和内核态的切换:
1.保存用户进程现场
2.合法性检查 (如内存)
3.参数传递
4.恢复现场
尽量多调用GLIBC库,如果GLIB库中能找到,就毫不犹豫使用它;
尽可能少调用系统接口,能一次搞定的避免多次。