引言
在前面讨论了进程,学习了Linux下进程概念、进程控制以及进程间通信。可以看到相关进程间可以存在一定的共享。
现在我们继续深入进程,了解如何使用多个线程在单进程环境中执行多个任务。进程中的所以线程都可以访问该进程的组成部分,如文件描述符和内存等。
下来让我们来学习线程。
为什么需要多线程?
有些情况需要在一个进程中同时执行多个控制流程,这时候就需要线程了。
比如实现一个图形界面的下载软件,一方面需要和用户交互,等待和处理用户鼠标键盘事件,另一方面又需要同时下载多个文件。这里就可以用多线程来实现,一个线程用来专门与用户交互,另外线程来负责下载文件等等操作。
进程和线程
有关进程的两个概念:
- 资源所有权:一个进程包括一个存放进程映像的虚拟地址空间;进程拥有对资源的控制和所有权包括内存、I/O通道、I/O设备和文件。操作系统执行保护功能,以防止进程之间发生不必要的与资源相关的冲突。
- 调度/执行:一个进程沿着通过一个或多个程序的一条执行路径执行。执行过程可能与其他进程的执行过程交替进行。因此,一个进程具有一个执行状态和分配优先级,并且是一个可被操作系统调度和分派的实体。
线程概念
线程,有时被称为轻量级进程,是程序执行流的最小单元。一个标准线程由线程ID,当前指令指针,寄存器集合和堆栈组成。线程是进程的一个实体,是系统独立调度和分派的基本单位,线程自己不拥有系统资源,只拥有一点在运行中必不可少的资源,但是线程可以同意进程的其他线程共享进程所拥有的全部资源。
每个程序都至少有一个线程,那就是程序本身。
由于在同一进程的多个线程共享同一地址空间,因此各线程共享大多数资源和环境:
- 文件描述符表
- 每种信号的处理方式
- 当前工作目录
- 用户和用户组id
但有些资源还是线程各自独有的:
- 线程id
- 上下文,包括各种寄存器的值、程序计数器和栈指针
- 栈空间
- erron变量
- 信号屏蔽字
- 调度优先级
从进程管理来说明进程和线程的区别。见下图,在单线程进程中,进程的表示包括它的进程控制块和用户地址空间,以及在进程执行中管理调用/返回行为的用户栈和内核栈。在多线程环境中,进程仍然只有一个与之关联的进程控制块和用户地址空间。但是每个线程都有独立的栈,还有独立的控制块用与一些独有信息。
因此进程中所以有线程共享该进程的状态和资源,他们在同一块地址空间中,并且可以访问到相同数据。