一、进程与线程
1. 先看下概念
- 进程:是资源进行分配的单位,是具有一定独立功能的程序关于某个数据集合上的一次运行活动,换句话说,在操作系统中运行中的程序就是进程;
- 线程:是进行资源调度和执行的单位 ;
2. 进程与线程的区别
区别 | 进程 | 线程 |
---|---|---|
根本区别 | 作为资源分配的单位 | 调度和执行的单位 |
开销 | 每个进程都有独立的代码和数据空间,进程间的切换会有较大的开销 | 线程可以看成是轻量级的进程,同一类线程共享代码和数据空间,每一个线程有独立的运行栈和程序计数器(PC),线程切换的开销较小 |
所处环境 | 在操作系统中能同时运行多个任务(程序) | 在同一应用程序中有多个顺序流同时执行 |
分配内存 | 系统在运行的时候会为每个进程分配不同的内存区域 | 除CPU之外,不会为线程分配内存(线程所使用的资源是它所属的进程的资源),线程组只能共享资源 |
包含关系 | 没有线程的进程是可以被看作单线程的,如果一个进程内拥有多个线程,则执行过程不是一条线的,而是多条线程共同完成的 | 线程是进程的一部分,所以线程有的时候被称为是轻权进程或轻量级进程 |
3. 进程
-
进程是指一个内存中运行的应用程序,每个进程都有自己独立的一块内存空间,即进程空间或(虚空间);
-
进程不依赖于线程而独立存在,一个进程中可以启动多个线程;
-
常见的进程间通信的方式
- 管道通信
- 消息队列
- 信号量机制
- 共享内存
4. 线程
-
线程是进程的一个实体,是CPU调度和分派的基本单位,它是指进程中的一个执行流程比进程更小的能独立运行的基本单位;
-
线程总是属于某个进程,线程没有自己的虚拟地址空间,一个进程中可以运行多个线程,所有线程一起共享分配给该进程的所有资源,多个线程共享内存,极大地提高了程序的运行效率。;
-
线程不能独立执行,必须依存在应用程序中,由应用程序提供多个线程执行控制,每个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口;
-
线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源。
-
线程之间的执行是相互独立的,哪一个线程优先执行取决于OS的调度;
-
线程有自己的堆栈和局部变量,一个线程包含以下内容:
- 指向当前被执行指令的指针;
- 栈;
- 寄存器值的集合,定义了一部分描述正在执行线程的处理器状态的值;
- 私有的数据区。
5. Java内存模型
到这里顺带提一下
- 方法区跟堆区是由所有线程共享的数据区;
- 虚拟机栈、本地方法栈以及程序计数器是线程隔离的,即是线程私有的数据区;
6. 进程和线程的关系
-
内核中,进程和线程都有独立的PCB(进程控制块),进程有独立的用户空间,但线程的用户空间是共享的;
-
一个进程可以包含多个线程,一个线程只属于一个进程;
-
进程与进程之间是相互独立隔离的,若一个进程崩溃,不会影响其他进程的正常执行,线程是隶属于进程,线程在进程间可以共享空间,一个线程的崩溃可能会影响到其他线程正常执行;
二、多线程的意义
- 充分利用CPU资源;
- 简化编程模式;
- 提高GUI的效率;
- 提高计算机的执行效率;
还有需要明确的:
很多多线程是模拟出来的,真正的多线程是指有很多个CPU,即多核,如服务器,如果是模拟出来的多线程,即一个CPU的情况下,在同一个时间点,CPU还是只能执行一个代码,因为切换的很快,所以就有同时执行的错觉;
-
线程就是独立的执行路径;
-
main()称之为主线程,为系统的入口点,用于执行整个程序;
-
在程序运行时, 即使没有自己创建线程,至少也会启动2个线程:一个是main主线程,一个是GC垃圾收集线程;
-
在一个进程中,如果开辟了多个线程,线程的运行由调度器安排调度,调度器是与操作系统紧密相关的,先后顺序不能人为干预;
-
对同一份资源操作时,会存在资源抢夺的问题,需要加入并发控制;
-
线程会带来额外的开销,如CPU调度时间,并发控制开销;
-
每个线程在自己的工作内存交互,加载和存储主内存控制不当会造成数据不一致;