Linux之进程-CSDN博客

本文链接：https://blog.csdn.net/pythonsys/article/details/147752803

第一章进程的本质：从程序到动态实体的进化史

1.1 程序 vs 进程：静态与动态的分水岭

程序（Program）：
是存储在磁盘上的二进制文件（如 ELF 格式），包含可执行的机器指令、数据、符号表等静态信息。例如/bin/bash是一个程序，未运行时只是硬盘上的一堆 0 和 1，不占用任何 CPU 或内存资源。
进程（Process）：
是程序的「一次执行实例」，是操作系统调度和资源分配的基本单位。当用户输入bash命令启动终端时，操作系统会创建一个进程，为其分配独立的内存空间、CPU 时间片、文件描述符等资源，并加载/bin/bash程序的代码到内存中运行。

核心区别：

特征	程序	进程
存在形式	静态文件（磁盘 / 内存）	动态实体（内核数据结构）
资源占用	无（未运行时）	占用 CPU、内存、文件等
独立性	无（可被多个进程共享）	有（默认相互隔离）
生命周期	永久（除非删除）	临时（创建→运行→终止）

1.2 进程的历史起源：从单任务到多任务的必然产物

单任务时代（1960 年代前）：
操作系统一次只能运行一个程序，资源分配简单（程序直接占用全部 CPU 和内存），不存在「进程」概念。例如早期的批处理系统，用户提交作业后，必须等待前一个作业完成才能运行下一个。
多道程序设计（1960 年代）：
为提高 CPU 利用率，操作系统引入「多道程序并发执行」：多个程序同时加载到内存，轮流占用 CPU。此时必须解决资源分配问题：每个程序需要独立的内存空间（避免互相覆盖代码）、独立的文件访问权限（避免误删其他程序的数据）。「进程」作为资源分配的载体应运而生，例如 UNIX 系统在 1969 年首次实现进程概念，通过fork()系统调用创建子进程。
现代操作系统（21 世纪）：
进程不仅是资源分配实体，更是隔离安全边界。例如 Linux 通过「命名空间（Namespace）」和「控制组（Cgroup）」技术，让容器（如 Docker）中的进程拥有独立的文件系统、网络、进程 ID 空间，实现更细粒度的资源隔离。

第二章进程如何承载系统资源：核心资源分配清单

2.1 CPU 资源：时间片与调度权

CPU 时间片分配：
进程通过操作系统的调度算法（如 Linux 的 CFS 完全公平调度器）获取 CPU 执行时间。每个进程在自己的时间片内占用 CPU 执行指令，时间片耗尽后，操作系统会保存该进程的 CPU 上下文（寄存器值、程序计数器 PC 等），切换到另一个进程（上下文切换）。
- 关键数据结构：Linux 的task_struct包含utime（用户态时间）、stime（内核态时间）等字段，记录进程累计使用的 CPU 时间。
调度优先级：
进程拥有优先级属性（如 nice 值，范围 - 20 到 19，数值越小优先级越高），决定其获取 CPU 时间片的频率。例如实时进程（如视频渲染）优先级高于普通交互式进程（如终端命令）。

2.2 内存资源：独立地址空间与虚拟内存

虚拟地址空间隔离：
每个进程拥有独立的虚拟地址空间（32 位系统通常为 4GB，64 位系统几乎无限大），分为用户空间和内核空间：
- 用户空间（约 3GB，32 位系统）：存放进程的代码（text 段）、数据（data/bss 段）、堆（动态分配内存）、栈（函数调用栈）。
- 内核空间（约 1GB，32 位系统）：存放内核代码和数据，所有进程共享，但用户态进程不能直接访问，必须通过系统调用进入内核态。
通过内存管理单元（MMU）和页表机制，虚拟地址会被映射到物理内存或磁盘交换分区（swap），确保进程 A 的内存地址不会访问到进程 B 的物理内存，实现内存隔离。
资源限制：
操作系统可通过ulimit命令或 Cgroup 限制进程的内存使用上限，例如防止某个进程占用过多内存导致系统崩溃。

2.3 文件与 I/O 资源：文件描述符表

文件描述符（File Descriptor, FD）：
每个进程维护一个独立的文件描述符表，默认打开 3 个标准文件：
- FD 0：标准输入（stdin），通常指向键盘或管道。
- FD 1：标准输出（stdout），通常指向屏幕或管道。
- FD 2：标准错误（stderr），通常指向屏幕或日志文件。
当进程调用open()函数打开文件时，系统会分配一个新的 FD（如 3、4、5），并记录该文件的打开模式（读 / 写 / 追加）、当前读写位置、文件权限等信息。不同进程的 FD 可以指向同一个文件（如多个进程读取同一个配置文件），但各自维护独立的读写位置。
I/O 设备控制：
进程访问硬件设备（如硬盘、网卡）时，操作系统通过设备文件（如/dev/sda）和驱动程序，将设备抽象为文件描述符，确保多个进程按顺序访问设备，避免硬件竞争（如两个进程同时向打印机发送数据导致乱码）。

2.4 进程间资源：IPC 机制与共享内存

进程间通信（IPC）：
虽然进程默认互相隔离，但操作系统提供了安全的资源共享机制，例如：
- 管道（Pipe）：父子进程间的单向数据流（如ls | grep）。
- 共享内存（Shared Memory）：多个进程映射同一块物理内存区域，用于高速数据交换（需配合信号量同步）。
- 套接字（Socket）：跨主机或本地进程间的网络通信（如客户端 - 服务器模型）。
这些机制本质上是操作系统在进程的资源清单中，允许其访问特定的共享资源，并通过权限检查（如用户 ID、组 ID）确保安全。

2.5 其他资源：权限、信号、定时器

用户权限：
进程拥有用户 ID（UID）和组 ID（GID），决定其对文件、目录的访问权限（读 / 写 / 执行），以及能否执行特权操作（如修改系统时间、绑定端口 80）。例如普通用户启动的进程 UID 为 1000，而 root 进程 UID 为 0。
信号（Signal）：
进程有自己的信号处理表，定义如何响应异步事件（如Ctrl+C发送 SIGINT 信号，默认终止进程）。不同进程可自定义信号处理方式（如忽略、捕获并处理）。
定时器：
进程可创建定时器（如setitimer()），到期时触发信号（如 SIGALRM），用于实现超时机制或周期性任务。

第三章为什么必须以进程为单位分配资源？三大核心需求

3.1 独立性：避免资源冲突与数据破坏

内存隔离案例：
假设两个进程 A 和 B 共享同一块内存空间，进程 A 在地址 0x1000 写入数据时，进程 B 可能误读或误写该地址，导致数据错误。通过虚拟地址空间隔离，进程 A 的 0x1000 对应物理内存 0x5000，进程 B 的 0x1000 对应物理内存 0x6000，两者互不干扰。
文件访问隔离案例：
进程 A 打开/etc/passwd文件并读取时，进程 B 同时打开该文件并写入（假设 B 有写入权限），操作系统会确保 B 的写入操作不会影响 A 当前的读取上下文（A 读到的是写入前的数据），因为每个进程维护独立的文件读写位置。

3.2 公平性：多任务环境下的资源调度

CPU 时间公平分配：
在多进程环境中，操作系统需要确保每个进程都能获得合理的 CPU 时间，避免某个进程垄断 CPU 导致其他进程饿死。例如 Linux 的 CFS 调度器为每个进程维护一个「虚拟运行时间」，优先调度虚拟运行时间较短的进程，实现公平性。
内存资源配额控制：
通过 Cgroup 技术，管理员可以为每个进程组分配固定比例的内存、CPU 核心数，例如限制 Docker 容器最多使用 2GB 内存，防止单个容器占用过多资源影响其他服务。

3.3 可管理性：操作系统的控制抓手

进程生命周期管理：
操作系统通过fork()创建进程，exec()替换进程执行的程序，wait()等待子进程结束，kill()终止进程。这些操作的前提是每个进程有唯一的标识符（PID）和独立的资源清单，否则操作系统无法精准控制资源回收（如进程终止时释放所有占用的内存和文件句柄）。
故障隔离：
当某个进程因 bug 导致内存越界或除以零错误时，操作系统会发送 SIGSEGV 或 SIGFPE 信号终止该进程，并释放其资源，避免故障扩散到其他进程或操作系统内核。例如浏览器的每个标签页作为独立进程，一个标签页崩溃不会影响其他标签页。

第四章 Linux 进程实现：从内核数据结构到资源分配流程

4.1 进程控制块：task_struct—— 资源清单的内核载体

在 Linux 内核中，每个进程对应一个task_struct结构体（定义在include/linux/sched.h），包含数百个字段，核心资源相关字段包括：

标识符：pid（进程 ID）、tgid（线程组 ID，用于多线程进程）。
内存管理：mm指针指向mm_struct，记录虚拟地址空间、页表、堆 / 栈信息。
文件系统：files指针指向files_struct，包含文件描述符表（数组）和打开的文件对象。
CPU 状态：thread_info记录 CPU 寄存器值、调度类、优先级（prio、nice）。
资源限制：rlimit数组记录该进程的资源上限（如最大文件打开数、最大内存使用量）。

4.2 进程创建时的资源分配流程（以 fork () 为例）

内核分配 task_struct：
调用alloc_task_struct()分配内存，初始化基本字段（如 PID、创建时间）。
复制父进程资源：
- 内存空间：默认使用写时复制（Copy-On-Write, COW）技术，子进程与父进程共享同一块物理内存，直到其中一方修改数据时才复制新的内存页。
- 文件描述符表：子进程复制父进程的文件描述符表，指向相同的文件对象，因此父子进程打开的文件会共享读写位置（如父进程读取了文件的前 10 字节，子进程继续从第 11 字节开始读）。
- 其他资源：复制信号处理表、用户权限（UID/GID）、定时器等，确保子进程初始状态与父进程一致。
调度器注册：
将新进程加入调度队列，分配初始 CPU 时间片，等待被调度执行。

4.3 资源释放：进程终止时的清理工作

当进程通过exit()系统调用或收到终止信号时，内核执行以下操作：

关闭所有文件描述符：遍历文件描述符表，调用close()释放文件锁、刷新缓冲区（如未写入磁盘的数据写入文件）。
释放内存资源：回收堆、栈、数据段占用的内存页，若使用 COW 技术，未修改的页可直接归还系统。
通知父进程：发送 SIGCHLD 信号给父进程，父进程通过wait()获取子进程退出状态，释放task_struct结构体。
Cgroup 资源回收：将进程占用的 CPU、内存配额归还给所属的控制组，供其他进程使用。

第五章进阶：资源分配的挑战与优化

5.1 资源竞争与同步：为什么需要互斥锁？

竞争条件（Race Condition）：
当多个进程同时访问共享资源（如共享内存、数据库记录）且操作顺序不确定时，可能导致数据不一致。例如两个进程同时读取并修改同一个计数器：
```
// 错误代码：未加锁的共享变量操作
int counter = 0;
// 进程A: 读取counter=0，计算counter+1=1，写入counter
// 进程B: 同时读取counter=0，计算counter+1=1，写入counter
// 最终counter=1，而非预期的2
```
解决方案：通过互斥锁（Mutex）、信号量（Semaphore）等同步机制，确保同一时刻只有一个进程访问共享资源。

5.2 轻量化资源分配：线程为何不是资源分配实体？

线程与进程的区别：
线程是「进程内的执行单元」，共享进程的资源（如内存空间、文件描述符表），但拥有独立的 CPU 上下文（栈、寄存器）。
- 进程：资源分配实体，创建 / 销毁开销大（需分配独立内存、文件表等）。
- 线程：调度执行实体，创建 / 销毁开销小（仅需分配栈空间和线程控制块）。
因此，操作系统将资源分配的粒度放在进程层面，而调度执行的粒度放在线程层面，兼顾资源隔离与执行效率。例如一个浏览器进程包含多个线程（渲染线程、网络线程、JS 引擎线程），共享进程的内存和网络连接，但各自独立调度。

5.3 容器与资源隔离的进化：从进程到 cgroups

传统进程隔离通过虚拟地址空间和文件描述符表实现，但无法限制进程对 CPU 核心数、内存带宽、磁盘 I/O 速率的占用。Linux 的 Cgroup（Control Groups）技术通过分层的资源控制树，实现更精细的分配：

CPU 资源：为容器分配特定的 CPU 核心（cpuset子系统）或 CPU 时间比例（cpu子系统）。
内存资源：限制容器的最大内存使用量（memory子系统），并支持内存过载时自动杀死超额使用的进程（OOM Killer）。
磁盘 I/O：通过blkio子系统限制容器对特定磁盘的读写速率。

这些技术让进程（或进程组）成为资源分配的「可配置单元」，满足云计算、微服务场景下的细粒度资源管理需求。

第六章总结：进程 —— 操作系统的资源管理基石

从本质上看，「进程作为分配系统资源的实体」是操作系统解决多任务冲突的核心方案：

隔离性：每个进程拥有独立的资源沙箱，避免互相干扰（如内存、文件、权限隔离）。
动态性：程序运行时才创建进程，按需分配资源（如fork()时分配 COW 内存，open()时分配文件描述符），结束时自动回收。
可控性：操作系统通过进程控制块（task_struct）精准管理每个进程的资源使用，实现调度、监控、限制和故障恢复。

对于 Linux 学习者来说，理解进程的资源分配角色，是掌握进程调度（top/ps命令）、内存管理（pmap/valgrind工具）、文件 I/O（lsof查看文件句柄）的基础。当你在终端输入ps aux看到一个个进程时，不妨想象它们是工厂里的工人，各自拿着专属的资源工具包，在操作系统的调度下，共同编织出复杂而有序的计算世界。

形象比喻：把进程比作「工厂里的工人」，轻松理解资源分配的本质

你可以把操作系统（比如 Linux）想象成一个「超级工厂」，而「进程」就是这个工厂里的「工人」。每个工人（进程）的存在意义，就是从工厂（操作系统）手里「领取干活需要的工具和材料」，然后完成特定的任务（比如打开浏览器上网、用 Word 写文档、让计算器算数学题）。

1. 为什么工厂要给每个工人分配专属资源？

场景 1：假设你是工厂老板，现在有两个工人：
- 工人 A 要「用电锯切割木板」（比如运行一个视频剪辑软件），需要工厂分配「电锯」（CPU 计算资源）、「木料仓库的 10 号货架」（内存空间）、「图纸文件」（打开的文件）。
- 工人 B 要「用缝纫机做衣服」（比如运行一个聊天软件），需要工厂分配「缝纫机」（另一个 CPU 核心）、「布料仓库的 5 号货架」（另一段内存）、「客户订单文件」（另一个打开的文件）。
如果工厂不分配资源，让两个工人共用同一把电锯和同一个货架，就会乱套：工人 A 切木板时，工人 B 可能把布料混进木料里，或者电锯被两个人同时抢着用，导致任务根本完不成。
结论：每个工人（进程）必须有自己专属的「工具包」（系统资源），才能独立干活，互不干扰。操作系统的任务就是当工人（程序运行时变成进程）申请资源时，给它们分配「专属资源包」，并确保资源不被滥用。

2. 进程如何「包装」资源？

每个工人（进程）手里都有一个「资源清单小本本」（操作系统内核里的进程控制块，比如 Linux 的task_struct），上面记录了这个工人当前拥有的所有资源：

正在用的工具：比如电锯（CPU 时间片）、缝纫机（GPU 资源）。
占用的仓库位置：比如内存里的 1000-2000 号存储单元（进程地址空间）。
打开的文件：比如正在编辑的「日记.txt」（文件描述符表）。
权限许可：比如能不能修改系统设置（用户权限）。

当工人干活累了（进程需要等待用户输入或磁盘读取），工厂会让它去休息（进程进入睡眠状态），并把它的「资源清单小本本」收起来（保存进程状态）。等它恢复精力（条件满足），再拿着小本本继续干活（恢复进程状态）。

3. 为什么说「进程是分配资源的实体」？

关键区别：程序（比如/usr/bin/chrome这个文件）是「静态的任务说明书」，而进程是「拿着说明书找工厂要资源干活的工人」。
只有当程序运行起来，变成进程，操作系统才会给它分配 CPU、内存、文件句柄等资源。
一句话总结：
进程就像一个「资源容器」，操作系统通过创建进程，把 CPU 时间、内存空间、文件权限等资源「打包分配」给它，让它能独立完成任务，同时避免不同任务互相干扰。