一般将进程定义成一个正在运行的程序的一个实例,它由以下两部分组成。
- 一个内核对象,操作系统用它来管理进程。内核对象也是系统保存进程统计信息的地方。
- 一个地址空间,其中包含所有可执行文件(exe)或DLL模块的代码和数据,此外它还包含动态内存分配,比如线程堆栈和堆的分配。
进程是有“惰性”的,它要做任何事情,都必须让一个线程在它的上下文中运行。该线程负责执行进程地址空间包含的代码。事实上,一个进程可以有多个线程,所有的线程都运行在进程的地址空间中“同时”执行代码。为此,每个线程都有它自己的一组CPU寄存器和它自己的堆栈。
每个进程至少要有一个线程来执行进程地址空间包含的代码。当系统创建一个进程的时候,会自动为进程创建一个线程,这称为主线程(primary thread)。然后,这个线程再创建更多的线程,后者再创建更多的线程......。如果没有线程要执行地址空间的代码,进程就失去了继续存在的理由。这时,系统会自动销毁进程及其地址空间。
对于所有要运行的线程,操作系统会轮流为每个线程调度一些CPU时间。它会采取循环(round-robin,轮询或轮流)的方式,为每个线程都分配时间片(称为“量”或者“量程”,即quantum),从而营造出所有线程都在“并发”运行的假象。
下图展示了一台单CPU机器的工作方式:
注:在单CPU的计算机上,操作系统以轮询的方式为每个单独的线程分配时间量