LinuxUNIX系统编程手册——(二)基本概念

2.1 操作系统的核心——内核

术语“操作系统”通常包含两种不同含义。

  • 指完整的软件包,这包括用来管理计算机资源的核心层软件,以及附带的所有标准软件工具,诸如命令行解释器、图形用户界面、文件操作工具和文本编辑器等。

  • 在更狭义的范围内,是指管理和分配计算机资源(即CPU、RAM和设备)的核心层软件。

术语“内核”通常是第二种含义,本书中的“操作系统”一词也是这层意思。

2.1.1 内核的职责

  • 进程调度:计算机内均配备有一个或多个 CPU(中央处理单元),以执行程序指令。与其他 UNIX 系统一样,Linux 属于抢占式多任务操作系统。“多任务”意指多个进程(即运行中的程序)可同时驻留于内存,且每个进程都能获得对 CPU 的使用权。“抢占”则是指一组规则。这组规则控制着哪些进程获得对 CPU 的使用,以及每个进程能使用多长时间,这两者都由内核进程调度程序(而非进程本身)决定。内核负责解决(多进程)访问硬件资源时可能引发的冲突,用户和进程对此则往往一无所知。

  • 内存管理:以一二十年前的标准来看,如今计算机的内存容量可谓相当可观,但软件的规模也保持了相应地增长,故而物理内存(RAM)仍然属于有限资源,内核必须以公平、高效地方式在进程间共享这一资源。与大多数现代操作系统一样,Linux也采用了虚拟内存管理机制,这项技术主要具有以下两方面的优势。

    • 进程与进程之间、进程与内核之间彼此隔离,因此一个进程无法读取或修改内核或其他进程的内存内容。

    • 只需将进程的一部分保持在内存中,这不但降低了每个进程对内存的需求量,而且还能在 RAM 中同时加载更多的进程。这也大幅提升了如下事件的发生概率,在任一时刻,CPU 都有至少一个进程可以执行,从而使得对 CPU 资源的利用更加充分。

  • 提供了文件系统:内核在磁盘之上提供有文件系统,允许对文件执行创建、获取、更新以及删除等操作。

  • 创建和终止进程:内核可将新程序载入内存,为其提供运行所需的资源(比如,CPU、内存以及对文件的访问等)。这样一个运行中的程序我们称之为“进程”。一旦进程执行完毕,内核还要确保释放其占用资源,以供后续程序重新使用。

  • 对设备的访问:计算机外接设备(鼠标、键盘、磁盘和磁带驱动器等)可实现计算机与外部世界的通信,这一通信机制包括输入、输出或是两者兼而有之。内核既为程序访问设备提供了简化版的标准接口,同时还要仲裁多个进程对每一个设备的访问。

  • 联网:内核以用户进程的名义收发网络消息(数据包)。该任务包括将网络数据包路由至目标系统。

  • 提供系统调用应用编程接口(API):进程可利用内核入口点(也称为系统调用)请求内核去执行各种任务。Linux 系统调用 API 是本书的主题。3.1 节会详细描述进程在执行系统调用时所经历的步骤。

2.1.2 内核态和用户态

现代处理器架构一般允许 CPU 至少在两种不同状态下运行,即:用户态和核心态(有时也称之为监管态 supervisor mode)。执行硬件指令可使 CPU 在两种状态间来回切换。与之对应,可将虚拟内存区域划分(标记)为用户空间部分内核空间部分。在用户态下运行时,CPU 只能访问被标记为用户空间的内存,试图访问属于内核空间的内存会引发硬件异常。当运行于核心态时,CPU 既能访问用户空间内存,也能访问内核空间内存。将操作系统置于内核空间。这确保了用户进程既不能访问内核指令和数据结构,也无法执行不利于系统运行的操作。

2.1.3 以进程及内核视角检视系统

一个运行系统通常会有多个进程并行其中。执行中的进程不清楚自己对 CPU 的占用何时“到期”,系统随之又会调度哪个进程来使用CPU(以及以何种顺序来调度),也不知道自己何时会再次获得对 CPU 的使用。信号的传递和进程间通信事件的触发由内核统一协调,对进程而言,随时可能发生。进程内存空间的某块特定部分如今到底是驻留在内存中还是被保存在交换空间(磁盘空间中的保留区域,作为计算机 RAM 的补充)里,进程本身并不知晓。与之类似,进程也不知道自己所访问的文件“居于”磁盘驱动器的何处,只是通过名称来引用文件而已。进程的运作方式堪称“与世隔绝” — 进程间彼此不能直接通信。进程本身无法创建出新进程,哪怕“自行了断”都不行。最后还有一点,进程也不能与计算机外接的输入输出设备直接通信。

相形之下,内核则是运行系统的中枢所在,由哪个进程来接掌对 CPU 的使用,何时“接任”,“任期”多久,都由内核说了算。在内核维护的数据结构中,包含了与所有正在运行的进程有关的信息。随着进程的创建、状态发生变化或者终结,内核会及时更新这些数据结构。内核所维护的底层数据结构可将程序使用的文件名转换为磁盘的物理位置。此外,每个进程的虚拟内存与计算机物理内存及磁盘交换区之间的映射关系,也在内核维护的数据结构之列。进程间的所有通信都要通过内核提供的通信机制来完成。响应进程发出的请求,内核会创建新的进程,终结现有进程。最后,由内核(特别是设备驱动程序)来执行与输入/输出设备之间的所有直接通信,按需与用户进程交互信息。

2.2 shell

shell 是一种具有特殊用途的程序,主要用于读取用户输入的命令,并执行相应的程序以响应命令。人们也称之为命令解释器。对 UNIX 系统而言,shell 只是一个用户进程

2.3 用户和组

系统会对每个用户的身份做唯一标识,用户可隶属于多个组。

2.3.1 用户

系统的每个用户都拥有唯一的登录名(用户名)和与之相对应的整数型用户ID(UID)。系统密码文件/etc/passwd 为每个用户都定义有一行记录,除了上述两项信息外,该记录还包含如下信息。

  • 组 ID:用户所属第一个组的整数型组 ID。

  • 主目录:用户登录后所居于的初始目录。

  • 登录 shell:执行以解释用户命令的程序名称。

该记录还能以加密形式保存用户密码。然而,出于安全考虑,用户密码往往存储于单独的 shadow 密码文件中,仅供特权用户阅读。

2.3.2 组

出于管理目的,尤其是为了控制对文件和其他资源的访问,将多个用户分组是非常实用的做法。每个用户组都对应着系统组文件/etc/group 中的一行记录,该记录包含如下信息。

  • 组名:(唯一的)组名称。

  • 组 ID(GID):与组相关的整数型 ID。

  • 用户列表:隶属于该组的用户登录名列表(通过密码文件记录的 group ID 字段未能标识出的该组其他成员,也在此列),以逗号分隔。

2.3.3 超级用户

超级用户在系统中享有特权。超级用户账号的用户 ID 为 0,通常登录名为 root。在一般的 UNIX 系统上,超级用户凌驾于系统的权限检查之上。因此,无论对文件施以何种访问权限限制,超级用户都可以访问系统中的任何文件,也能发送信号干预系统运行的所有用户进程。系统管理员可以使用超级用户账号来执行各种系统管理任务。

2.4 单根目录层级、目录、链接及文件

内核维护着一套单根目录结构,以放置系统的所有文件。(这与微软 Windows 之类的操作系统形成了鲜明对照,Windows 系统的每个磁盘设备都有各自的目录层级。)这一目录层级的根基就是名为“/”的根目录。所有的文件和目录都是根目录的“子孙”。

图 2-1 Linux 单根目录层级的一部分

2.4.1 文件类型

在文件系统内,会对文件类型进行标记,以表明其种类。其中一种用来表示普通数据文件,人们常称之为“普通文件”或“纯文本文件”,以示与其他种类的文件有所区别。其他文件类型包括设备、管道、套接字、目录以及符号链接。

2.4.2 路径和链接

目录是一种特殊类型的文件,内容采用表格形式,数据项包括文件名以及对相应文件的引用。这一“文件名+引用”的组合被称为链接。每个文件都可以有多条链接,因而也可以有多个名称,在相同或不同的目录中出现。

目录可包含指向文件或其他目录的链接。每个目录至少包含两条记录:.和..,前者是指向目录自身的链接,后者是指向其上级目录 —父目录的链接。除根目录外,每个目录都有父目录。对于根目录而言,..是指向根目录自身的链接(因此,/..等于/)。

2.4.3 符号链接

在目录列表中,普通链接是内容为“文件名+指针”的一条记录,而符号链接则是经过特殊标记的文件,内容包含了另一文件的名称。(换言之,一个符号链接对应着目录中内容为“文件名+指针”的一条记录,指针指向的文件内容为另一个文件名的字符串。)所谓“另一文件”通常被称为符号链接的目标,人们一般会说符号链接“指向”或“引用”目标文件。在多数情况下,只要系统调用用到了路径名,内核会自动解除(换言之,按照)该路径名中符号链接的引用,以符号链接所指向的文件名来替换符号链接。若符号链接的目标文件自身也是一个符号链接,那么上述过程会以递归方式重复下去。(为了应对可能出现的循环引用,内核对解除引用的次数作了限制。)如果符号链接指向的文件并不存在,那么可将该链接视为空链接(dangling link)。通常,人们会分别使用硬链接(hard link)或软链接(soft link)这样的术语来指代正常链接和符号链接。

2.4.4 文件名

在大多数 Linux 文件系统上,文件名最长可达 255 个字符。文件名可以包含除“/”和空字符(\0)外的所有字符。但是,只建议使用字母、数字、点(“.”)、下划线(“”)以及连字符(“−”)。SUSv3 将这 65 个字符的集合[-.a-zA-Z0-9]称为可移植文件名字符集(portable filename character set)。

对于可移植文件名字符集以外的字符,由于其可能会在 shell、正则表达式或其他场景中具有特殊含义,故而应避免在文件名中使用。如在上述环境中出现了包含特殊含义字符的文件名,则需要进行转义,即对此类字符进行特殊标记(一般会在特殊字符前插入一个“\”),以指明不应以特殊含义对其进行解释。若场境不支持转义机制,则不能使用此类文件名。此外,还应避免以连字符(“-”)作为文件名的起始字符,因为一旦在 shell 命令中使用这种文件名,会被误认为命令行选项开关。

2.4.5 路径名

路径名是由一系列文件名组成的字符串,彼此以“/”分隔,首字符可以为“/”(非强制) 。除却最后一个文件名外,该系列文件名均为目录名称(或为指向目录的符号链接)。路径名的尾部可标识任意类型的文件,包括目录在内。有时将该字符串中最后一个“/”字符之前的部分称为路径名的目录部分,将其之后的部分称为路径名的文件部分或基础部分。

路径名应按从左至右的顺序阅读,路径名中每个文件名之前的部分,即为该文件所处目录。路径名描述了单根目录层级下的文件位置,又可分为绝对路径名和相对路径名:

  • 绝对路径名以“/”开始,指明文件相对于根目录的位置。

  • 相对路径名定义了相对于进程当前工作目录(见下文)的文件位置,与绝对路径名相比,相对路径名缺少了起始的“/”。

2.4.6 当前工作目录

每个进程都有一个当前工作目录(有时简称为进程工作目录或当前目录)。这就是单根目录层级下进程的“当前位置”,也是进程解释相对路径名的参照点。 进程的当前工作目录继承自其父进程。

2.4.7 文件的所有权和权限

每个文件都有一个与之相关的用户 ID 和组 ID,分别定义文件的属主和属组。系统根据文件的所有权来判定用户对文件的访问权限。

为了访问文件,系统把用户分为 3 类:文件的属主(有时,也称为文件的用户)、与文件组(group)ID 相匹配的属组成员用户以及其他用户。可为以上 3 类用户分别设置 3 种权限(共计 9 种权限位):只允许查看文件内容的读权限;允许修改文件内容的写权限;允许执行文件的执行权限。这里的文件要么指程序,要么是交由某种解释程序(通常指 shell 的一种,但也有例外)处理的脚本。

也可针对目录进行上述权限设置,但意义稍有不同。读权限允许列出目录内容(即该目录下的文件名),写权限允许对目录内容进行更改(比如,添加、修改或删除文件名),执行(有时也称为搜索)权限允许对目录中的文件进行访问(但需受文件自身访问权限的约束)。

2.5 文件 I/O 模型

UNIX 系统 I/O 模型最为显著的特性之一是其 I/O 通用性概念。也就是说,同一套系统调用(open()、read()、write()、close()等)所执行的 I/O 操作,可施之于所有文件类型,包括设备文件在内。(应用程序发起的 I/O 请求,内核会将其转化为相应的文件系统操作,或者设备驱动程序操作,以此来执行针对目标文件或设备的 I/O 操作。)因此,采用这些系统调用的程序能够处理任何类型的文件。

就本质而言,内核只提供一种文件类型:字节流序列,在处理磁盘文件、磁盘或磁带设备时,可通过 lseek()系统调用来随机访问。

2.5.1 文件描述符

I/O 系统调用使用文件描述符 ——(往往是数值很小的)非负整数——来指代打开的文件。获取文件描述符的常用手法是调用 open(),在参数中指定 I/O 操作目标文件的路径名。

通常,由 shell 启动的进程会继承 3 个已打开的文件描述符:描述符 0 为标准输入,指代进程提供输入的文件;描述符 1 为标准输出,指代供进程写入输出的文件;描述符 2 为标准错误,指代供进程写入错误消息或异常通告的文件。在交互式 shell 或程序中,上述三者一般都指向终端。在 stdio 函数库中,这几种描述符分别与文件流 stdin、stdout 和 stderr 相对应。

2.5.2 stdio 函数库

C 编程语言在执行文件 I/O 操作时,往往会调用 C 语言标准库的 I/O 函数。也将这样一组I/O 函数称为 stdio 函数库,其中包括 fopen()、fclose()、scanf()、printf()、fgets()、fputs()等。stdio 函数位于 I/O 系统调用层(open()、close()、read()、write()等)之上。

2.6 程序

程序通常以两种面目示人。其一为源码形式,由使用编程语言(比如,C 语言)写成的一系列语句组成,是人类可以阅读的文本文件。要想执行程序,则需将源码转换为第二种形式 — 计算机可以理解的二进制机器语言指令。(这与脚本形成了鲜明对照,脚本是包含命令的文本文件,可以由 shell 或其他命令解释器之类的程序直接处理。)

2.6.1 过滤器

从 stdin 读取输入,加以转换,再将转换后的数据输出到 stdout,常常将拥有上述行为的程序称为过滤器,cat、grep、tr、sort、wc、sed、awk 均在其列。

2.6.2 命令行参数

C 语言程序可以访问命令行参数,即程序运行时在命令行中输入的内容。要访问命令行参数,程序的 main()函数需做如下声明:int main(int argc, char *argv[])

argc 变量包含命令行参数的总个数,argv 指针数组的成员指针则逐一指向每个命令行参数字符串。首个字符串 argv[0],标识程序名本身.

2.7 进程

简而言之,进程是正在执行的程序实例。执行程序时,内核会将程序代码载入虚拟内存,为程序变量分配空间,建立内核记账(bookkeeping)数据结构,以记录与进程有关的各种信息(比如,进程 ID、用户 ID、组 ID 以及终止状态等)。

在内核看来,进程是一个个实体,内核必须在它们之间共享各种计算机资源。对于像内存这样的受限资源来说,内核一开始会为进程分配一定数量的资源,并在进程的生命周期内,统筹该进程和整个系统对资源的需求,对这一分配进行调整。程序终止时,内核会释放所有此类资源,供其他进程重新使用。其他资源(如 CPU、网络带宽等)都属于可再生资源,但必须在所有进程间平等共享。

2.7.1 进程的内存布局

逻辑上将一个进程划分为以下几部分(也称为段)。

  • 文本:程序的指令。

  • 数据:程序使用的静态变量。

  • 堆:程序可从该区域动态分配额外内存。

  • 栈:随函数调用、返回而增减的一片内存,用于为局部变量和函数调用链接信息分配存储空间。

2.7.2 创建进程和执行程序

进程可使用系统调用 fork()来创建一个新进程。调用 fork()的进程被称为父进程,新创建的进程则被称为子进程。内核通过对父进程的复制来创建子进程。子进程从父进程处继承数据段、栈段以及堆段的副本后,可以修改这些内容,不会影响父进程的“原版”内容。(在内存中被标记为只读的程序文本段则由父、子进程共享。)

然后,子进程要么去执行与父进程共享代码段中的另一组不同函数,或者,更为常见的情况是使用系统调用 execve()去加载并执行一个全新程序。execve()会销毁现有的文本段、数据段、栈段及堆段,并根据新程序的代码,创建新段来替换它们。

以 execve()为基础,C 语言库还提供了几个相关函数,接口虽然略有不同,但功能全都相同。以上所有库函数的名称均以字符串“exec”打头,在函数间差异无关宏旨的场合,本书会用符号exec()作为这些库函数的统称。不过,请读者牢记,实际上根本不存在名为 exec()的库函数。一般情况下,书中会使用“执行”一词来指代 execve()及其衍生函数所实施的操作。

2.7.3 进程 ID 和父进程 ID

可使用以下两种方式之一来终止一个进程:其一,进程可使用exit()系统调用(或相关的exit()库函数),请求退出;其二,向进程传递信号,将其“杀死”。无论以何种方式退出,进程都会生成“终止状态”,一个非负小整数,可供父进程的 wait()系统调用检测。在调用exit()的情况下,进程会指明自己的终止状态。若由信号来“杀死”进程,则会根据导致进程“死亡”的信号类型来设置进程的终止状态。(有时会将传递进exit()的参数称为进程的“退出状态”,以示与终止状态有所不同,后者要么指传递给exit()的参数值,要么表示“杀死”进程的信号。)

根据惯例,终止状态为 0 表示进程“功成身退”,非 0 则表示有错误发生。大多数 shell 会将前一执行程序的终止状态保存于 shell 变量$?中。

2.7.4 进程的用户和组标识符(凭证)

每个进程都有一组与之相关的用户 ID (UID)和组 ID (GID),如下所示。

  • 真实用户 ID 和组 ID:用来标识进程所属的用户和组。新进程从其父进程处继承这些 ID。登录 shell 则会从系统密码文件的相应字段中获取其真实用户 ID 和组 ID。

  • 有效用户 ID 和组 ID:进程在访问受保护资源(比如,文件和进程间通信对象)时,会使用这两个 ID(并结合下述的补充组 ID)来确定访问权限。一般情况下,进程的有效 ID 与相应的真实 ID 值相同。正如即将讨论的那样,改变进程的有效ID 实为一种机制,可使进程具有其他用户或组的权限。

  • 补充组 ID:用来标识进程所属的额外组。新进程从其父进程处继承补充组 ID。登录shell 则从系统组文件中获取其补充组 ID。

2.7.5 特权进程

在 UNIX 系统上,就传统意义而言,特权进程是指有效用户 ID 为 0(超级用户)的进程。通常由内核所施加的权限限制对此类进程无效。与之相反,术语“无特权”(或非特权)进程是指由其他用户运行的进程。此类进程的有效用户ID 为非0 值,且必须遵守由内核所强加的权限规则。由某一特权进程创建的进程,也可以是特权进程。例如,一个由 root(超级用户)发起的登录 shell。成为特权进程的另一方法是利用 set-user-ID 机制,该机制允许某进程的有效用户ID 等同于该进程所执行程序文件的用户 ID。

2.7.6 init 进程

系统引导时,内核会创建一个名为 init 的特殊进程,即“所有进程之父”,该进程的相应程序文件为/sbin/init。系统的所有进程不是由 init(使用 frok())“亲自”创建,就是由其后代进程创建。init 进程的进程号总为 1,且总是以超级用户权限运行。谁(哪怕是超级用户)都不能“杀死”init 进程,只有关闭系统才能终止该进程。init 的主要任务是创建并监控系统运行所需的一系列进程。

2.7.7 守护进程

守护进程指的是具有特殊用途的进程,系统创建和处理此类进程的方式与其他进程相同,但以下特征是其所独有的:

  • 守护进程通常在系统引导时启动,直至系统关闭前,会一直“健在”。

  • 守护进程在后台运行,且无控制终端供其读取或写入数据。

2.7.8 环境列表

每个进程都有一份环境列表,即在进程用户空间内存中维护的一组环境变量。这份列表的每一元素都由一个名称及其相关值组成。由 fork()创建的新进程,会继承父进程的环境副本。这也为父子进程间通信提供了一种机制。当进程调用 exec()替换当前正在运行的程序时,新程序要么继承老程序的环境,要么在 exec()调用的参数中指定新环境并加以接收。

在绝大多数shell中,可使用export命令来创建环境变量(C shell使用setenv命令),如:$ export MYVAR='Hello world'

C 语言程序可使用外部变量(char **environ)来访问环境,而库函数也允许进程去获取或修改自己环境中的值。

环境变量的用途多种多样。例如,shell 定义并使用了一系列变量,供shell 执行的脚本和程序访问。其中包括:变量 HOME(明确定义了用户登录目录的路径名)、变量 PATH(指明了用户输入命令后,shell 查找与之相应程序时所搜索的目录列表)

2.7.9 资源限制

每个进程都会消耗诸如打开文件、内存以及CPU 时间之类的资源。使用系统调用setrlimit(),进程可为自己消耗的各类资源设定一个上限。此类资源限制的每一项均有两个相关值:软限制(soft limit)限制了进程可以消耗的资源总量,硬限制(hard limit)软限制的调整上限。非特权进程在针对特定资源调整软限制值时,可将其设置为 0 到相应硬限制值之间的任意值,但硬限制值则只能调低,不能调高。

由 fork()创建的新进程,会继承其父进程对资源限制的设置。

使用 ulimit 命令(在 C shell 中为 limit)可调整 shell 的资源限制。shell 为执行命令所创建的子进程会继承上述资源设置。

2.8 内存映射

调用系统函数 mmap()的进程,会在其虚拟地址空间中创建一个新的内存映射。映射分为两类。

  • 文件映射:将文件的部分区域映射入调用进程的虚拟内存。映射一旦完成,对文件映射内容的访问则转化为对相应内存区域的字节操作。映射页面会按需自动从文件中加载。

  • 并无文件与之相对应的是匿名映射,其映射页面的内容会被初始化为 0。

由某一进程所映射的内存可以与其他进程的映射共享。达成共享的方式有二:其一是两个进程都针对某一文件的相同部分加以映射,其二是由 fork()创建的子进程自父进程处继承映射。当两个或多个进程共享的页面相同时,进程之一对页面内容的改动是否为其他进程所见呢?这取决于创建映射时所传入的标志参数。若传入标志为私有,则某进程对映射内容的修改对于其他进程是不可见的,而且这些改动也不会真地落实到文件上;若传入标志为共享,对映射内容的修改就会为其他进程所见,并且这些修改也会造成对文件的改动。内存映射用途很多,其中包括:以可执行文件的相应段来初始化进程的文本段、内存(内容填充为 0)分配、文件 I/O(即映射内存 I/O)以及进程间通信(通过共享映射)。

2.9 静态库和共享库

2.9.1 静态库

本质上说来,静态库是对已编译目标模块的一种结构化整合。要使用静态库中的函数,需要在创建程序的链接命令中指定相应的库。主程序会对静态库中隶属于各目标模块的不同函数加以引用。链接器在解析了引用情况后,会从库中抽取所需目标模块的副本,将其复制到最终的可执行文件中,这就是所谓静态链接。对于所需库内的各目标模块,采用静态链接方式生成的程序都存有一份副本。这会引起诸多不便。其一,在不同的可执行文件中,可能都存有相同目标代码的副本,这是对磁盘空间的浪费。同理,调用同一库函数的程序,若均以静态链接方式生成,且又于同时加以执行,这会造成内存浪费,因为每个程序所调用的函数都各有一份副本驻留在内存中,此其二。此外,如果对库函数进行了修改,需要重新加以编译、生成新的静态库,而所有需要调用该函数“更新版”的应用,都必须与新生成的静态库重新链接。

2.9.2 共享库

设计共享库的目的是为了解决静态库所存在的问题。如果将程序链接到共享库,那么链接器就不会把库中的目标模块复制到可执行文件中,而是在可执行文件中写入一条记录,以表明可执行文件在运行时需要使用该共享库。一旦在运行时将可执行文件载入内存,一款名为“动态链接器”的程序会确保将可执行文件所需的动态库找到,并载入内存,随后实施运行时链接,解析可执行文件中的函数调用,将其与共享库中相应的函数定义关联起来。在运行时,共享库代码在内存中只需保留一份,且可供所有运行中的程序使用。经过编译处理的函数仅在共享库内保存一份,从而节约了磁盘空间。另外,这一设计还能确保各类程序及时使用到函数的最新版本,功莫大焉,只需将带有函数新定义体的共享库重新加以编译即可,程序会在下次执行时自动使用新函数。

2.10 进程间通信及同步

Linux 系统上运行有多个进程,其中许多都是独立运行,有些进程必须相互合作以达成预期目的,因此彼此间需要通信和同步机制。Linux 提供了丰富的进程间通信(IPC)机制,如下所示。

  • 信号(signal),用来表示事件的发生。

  • 管道(亦即 shell 用户所熟悉的“|”操作符)和 FIFO,用于在进程间传递数据。

  • 套接字,供同一台主机或是联网的不同主机上所运行的进程之间传递数据。

  • 文件锁定,为防止其他进程读取或更新文件内容,允许某进程对文件的部分区域加以锁定。

  • 消息队列,用于在进程间交换消息(数据包)。

  • 信号量(semaphore),用来同步进程动作。

  • 共享内存,允许两个及两个以上进程共享一块内存。当某进程改变了共享内存的内容时,其他所有进程会立即了解到这一变化。

2.11 信号

人们往往将信号称为“软件中断”。进程收到信号,就意味着某一事件或异常情况的发生。信号的类型很多,每一种分别标识不同的事件或情况。采用不同的整数来标识各种信号类型,并以 SIGxxxx 形式的符号名加以定义。

内核、其他进程(只要具有相应的权限)或进程自身均可向进程发送信号。例如,发生下列情况之一时,内核可向进程发送信号。

  • 用户键入中断字符(通常为 Control-C)。

  • 进程的子进程之一已经终止。

  • 由进程设定的定时器(告警时钟)已经到期。

  • 进程尝试访问无效的内存地址。

在 shell 中,可使用 kill 命令向进程发送信号。在程序内部,系统调用 kill()可提供相同的功能。

收到信号时,进程会根据信号采取如下动作之一。

  • 忽略信号。

  • 被信号“杀死”。

  • 先挂起,之后再被专用信号唤醒。

就大多数信号类型而言,程序可选择不采取默认的信号动作,而是忽略信号(当信号的默认处理行为并非忽略此信号时,会派上用场)或者建立自己的信号处理器。信号处理器是由程序员定义的函数,会在进程收到信号时自动调用,根据信号的产生条件执行相应动作。信号从产生直至送达进程期间,一直处于挂起状态。通常,系统会在接收进程下次获得调度时,将处于挂起状态的信号同时送达。如果接收进程正在运行,则会立即将信号送达。然而,程序可以将信号纳入所谓“信号屏蔽”以求阻塞该信号。如果产生的信号处于“信号屏蔽”之列,那么此信号将一直保持挂起状态,直至解除对该信号的阻塞。(亦即从信号屏蔽中移除。)

2.12 线程

每个进程都可执行多个线程,可将线程想象为共享同一虚拟内存及一干其他属性的进程。每个线程都会执行相同的程序代码,共享同一数据区域和堆。可是,每个线程都拥有属于自己的栈,用来装载本地变量和函数调用链接信息。

线程之间可通过共享的全局变量进行通信。借助于线程 API 所提供的条件变量和互斥机制,进程所属的线程之间得以相互通信并同步行为 — 尤其是在对共享变量的使用方面。此外,利用 2.10 节所述的 IPC 和同步机制,线程间也能彼此通信。

线程的主要优点在于协同线程之间的数据共享(通过全局变量)更为容易,而且就某些算法而论,以多线程来实现比之以多进程实现要更加自然。再者,多线程应用能从多处理器硬件的并行处理中获益匪浅。

2.13 进程组和 shell 任务控制

shell 执行的每个程序都会在一个新进程内发起。比如,shell 创建了 3 个进程来执行以下管道命令(在当前的工作目录下,根据文件大小对文件进行排序并显示):$ ls -l | sort -k5n | less

shell 提供了一种交互式特性,名为任务控制。该特性允许用户同时执行并操纵多条命令或管道。在支持任务控制的 shell 中,会将管道内的所有进程置于一个新进程组或任务中。(如果情况很简单,shell 命令行只包含一条命令,那么就会创建一个只包含单个进程的新进程组。)进程组中的每个进程都具有相同的进程组标识符(以整数形式),其实就是进程组中某个进程(也称为进程组组长 process group leader)的进程 ID

2.14 会话、控制终端和控制进程

会话指的是一组进程组(任务)。会话中的所有进程都具有相同的会话标识符。会话首进程(session leader)是指创建会话的进程,其进程 ID 会成为会话 ID。

使用会话最多的是支持任务控制的 shell,由 shell 创建的所有进程组与 shell 自身隶属于同一会话,shell 是此会话的会话首进程。

通常,会话都会与某个控制终端相关。控制终端建立于会话首进程初次打开终端设备之时。对于由交互式 shell 所创建的会话,这恰恰是用户的登录终端。一个终端至多只能成为一个会话的控制终端。

打开控制终端会致使会话首进程成为终端的控制进程。一旦断开了与终端的连接(比如,关闭了终端窗口),控制进程将会收到 SIGHUP 信号。

在任一时点,会话中总有一个前台进程组(前台任务),可以从终端中读取输入,向终端发送输出。如果用户在控制终端中输入了“中断”(通常是 Control-C)或“挂起”字符(通常是 Control-Z),那么终端驱动程序会发送信号以终止或挂起(亦即停止)前台进程组。一个会话可以拥有任意数量的后台进程组(后台任务),由以“&”字符结尾的行命令来创建。

2.15 伪终端

伪终端是一对相互连接的虚拟设备,也称为主从设备。在这对设备之间,设有一条 IPC信道,可供数据进行双向传递。

从设备(slave device)所提供的接口,其行为方式与终端相类似,基于这一特点,可以将某个为终端编写的程序与从设备连接起来,然后,再利用连接到主设备的另一程序来驱动这一“面向终端”的程序,这是伪终端的一个关键用途。由“驱动程序”所产生的输出,在经由终端驱动程序的常规输入处理(例如,默认情况下,会把回车符映射为换行符)后,会作为输入传递给与从设备相连的面向终端的程序。而由面向终端的程序向从设备写入的任何数据又作为“驱动程序”的输入来传递(在执行完所有常规的终端输入处理后)。换句话说,“驱动程序”所履行的功能,在效果上等同于用户通常在传统终端上所执行的操作。

伪终端广泛应用于各种应用领域,最知名的要数 telnet 和 ssh 之类提供网络登录服务的应用,以及 X Window 系统所提供的终端窗口实现。

2.16 日期和时间

进程涉及两种类型的时间。

  • 真实时间:指的是在进程的生命期内(所经历的时间或时钟时间),以某个标准时间点(日历时间)或固定时间点(通常是进程的启动时间)为起点测量得出的时间。在UNIX 系统上,日历时间是以国际协调时间(简称 UTC)1970 年 1 月 1 日凌晨为起始点,按秒测量得出的时间,再进行时区调整(定义时区的基准点为穿过英格兰格林威治的经线)这一日期与 UNIX 系统的生日很接近,也被称为纪元(Epoch)。

  • 进程时间:亦称为 CPU 时间,指的是进程自启动起来,所占用的 CPU 时间总量。可进一步将 CPU 时间划分为系统 CPU 时间用户 CPU 时间。前者是指在内核模式中,执行代码所花费的时间(比如,执行系统调用,或代表进程执行其他的内核服务)。后者是指在用户模式中,执行代码所花费的时间(比如,执行常规的程序代码)。

time 命令会显示出真实时间、系统 CPU 时间,以及为执行管道中的多个进程而花费的用户 CPU 时间。

2.17 客户端/服务器架构

客户端/服务器应用由两个组件进程组成。

  • 客户端:向服务器发送请求消息,请求服务器执行某些服务。

  • 服务器:分析客户端的请求,执行相应的动作,然后,向客户端回发响应消息。

2.18 /proc 文件系统

/proc 文件系统,由一组目录和文件组成,挂载(mount)于/proc 目录下。/proc 文件系统是一种虚拟文件系统,以文件系统目录和文件形式,提供一个指向内核数据结构的接口。这方便查看和改变各种系统属性。此外,还能通过一组以/proc/PID 形式命名的目录(PID 即进程 ID)查看系统中运行各进程的相关信息。

通常,/proc 目录下的文件内容都采取人类可读的文本形式,shell 脚本也能对其进行解析。程序可以打开、读取和写入/proc 目录下的既定文件。大多数情况下,只有特权级进程才能修改/proc 目录下的文件内容。

  • 20
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Linux/Unix系统编程手册》是一本经典的系统编程参考书籍,该书主要介绍了Linux/Unix系统编程基本概念、技术和方法。 首先,该书详细介绍了Linux/Unix系统的基本原理和工作机制,包括文件系统、进程管理、内存管理、输入输出等。通过理解这些基本原理,读者可以深入了解Linux/Unix操作系统的核心部分,为系统编程奠定坚实的基础。 其次,该书介绍了系统调用接口及其使用方法。系统调用是用户程序与操作系统之间进行交互的重要接口,通过调用系统调用完成文件读写、进程创建、信号处理等功能。在书中,读者可以学习到如何使用各种系统调用完成各种常见任务,并了解系统调用的参数和返回值的含义。 此外,该书还介绍了多进程和多线程编程技术。多进程和多线程是提高程序性能和并发性的重要手段。该书详细介绍了进程和线程的概念、创建和销毁的方法,以及进程间通信和线程同步的技术,帮助读者理解和掌握这些关键技术。 最后,该书还介绍了网络编程和套接字编程。网络编程是现代计算机系统的重要方向之一,通过网络编程可以实现不同计算机之间的数据传输和通信。该书通过介绍套接字编程原理和使用代码,让读者了解如何通过套接字进行网络通信,并介绍了常见的应用层协议和网络编程的一些技巧。 总之,《Linux/Unix系统编程手册》是一本非常有价值的参考书籍,它不仅帮助读者深入了解Linux/Unix操作系统的底层原理,还提供了实践经验和案例,对于想要深入学习系统编程的开发者来说,是一本必不可少的读物。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值