什么是进程
UNIX标准(特别是IEEE Std 1003.1,2004年版)把进程定义为:一个其中运行着一个或多个线程的地址空间和这些线程所需要的系统资源。 目前,可以把进程看作正在运行的程序。
像Linux这样的多任务操作系统可以同时运行多个程序。每个运行着的程序实例就构成一个进程。
作为多用户系统,Linux允许许多用户同时访问系统。每个用户可以同时运行许多个程序,甚至同时运行同一个程序的许多个实例。系统本身也运行着一些管理系统资源和控制用户访问的程序。
正在运行的程序或进程由程序代码、数据、变量(占用着系统内存)、打开的文件(文件描述符)和环境组成。一般来说,Linux系统会在进程之间共享程序代码和系统函数库,所以在任何时刻内存中都只有代码的一份副本。
进程的结构
我们来看看操作系统是如何管理多个进程的。如果有两个用户neil和rick,他们同时运行grep程序在不同的文件中查找不同的字符串。他们使用的进程如图所示。
如果在搜索结束之前运行ps命令,则该命令输出类似下面这样的内容:
每个进程都会被分配一个唯一的数字编号,我们称之为进程标识符或PID。它通常是一个取值范围从2到32768的正整数。当进程被启动时,系统将按顺序选择下一个未被使用的数字作为它的PID,当数字已经回绕一圈时,新的PID重新从2开始。数字1一般是为特殊进程init保留的,init进程负责管理其他进程,我们很快就会再次谈到它。这里我们可以看到由用户neil和rick启动的两个进程被分配的PID分别是101和102。
将要被grep命令执行的程序代码被保存在一个磁盘文件中。正常情况下,Linux进程不能对用来存放程序代码的内存区域进行写操作,即程序代码是以只读方式加载到内存中的