1. 进程与线程
1.1 进程与线程
1.1.1 进程
- 程序由指令和数据组成,是一个静态的概念。当程序被加载到内存中运行起来时为进程,进程是动态的概念,进程是用来加载指令、管理内存、管理IO的
- 当一个程序被运行,从磁盘加载这个程序的代码到内存中,这就相当于开启了一个进程
- 进程就可以视为程序的一个实例。大部分程序可以同时运行多个实例进程(例如记事本、画图、浏览器 等),也有的程序只能启动一个实例进程(例如网易云音乐、360 安全卫士等)
1.1.2 线程
- 一个进程之内可以分为一到多个线程。
- 一个线程就是一个指令流,将指令流中的一条条指令以一定的顺序交给 CPU 执行
- Java 中,线程作为最小调度单位,进程作为资源分配的最小单位。 在 windows 中进程是不活动的,只是作为线程的容器
1.1.3 进程 VS 线程
进程基本上相互独立的,而线程存在于进程内,是进程的一个子集
进程拥有共享的资源,如内存空间等,供其内部的线程共享
进程间通信较为复杂
- 同一台计算机的进程通信称为 IPC(Inter-process communication)
- 不同计算机之间的进程通信,需要通过网络,并遵守共同的协议,例如 HTTP
线程通信相对简单,因为它们共享进程内的内存,一个例子是多个线程可以访问同一个共享变量 线程更轻量,线程上下文切换成本一般上要比进程上下文切换低
从上图可以看出:一个进程中可以有多个线程,多个线程共享进程的堆和方法区 (JDK1.8 之后的元空间)资源,但是每个线程有自己的程序计数器、虚拟机栈 和 本地方法栈。
总结: 线程是进程划分成的更小的运行单位。线程和进程最大的不同在于基本上各进程是独立的,而各线程则不一定,因为同一进程中的线程极有可能会相互影响。线程执行开销小,但不利于资源的管理和保护;而进程正相反。
1.2 并行与并发
并发(concurrent)是同一时间应对(dealing with)多件事情的能力
并行(parallel)是同一时间动手做(doing)多件事情的能力
1.2.1 并发
单核 cpu 下,线程实际还是串行执行的。操作系统中有一个组件叫做任务调度器,将 cpu 的时间片(windows 下时间片最小约为 15 毫秒)分给不同的程序使用,只是由于 cpu 在线程间(时间片很短)的切换非常快,人类感觉是同时运行的 。总结为一句话就是: 微观串行,宏观并行 , 一般会将这种线程轮流使用 CPU 的做法称为并发
1.2.2 并行
并行(Parallel),当系统有一个以上CPU时,当一个CPU执行一个进程时,另一个CPU可以执行另一个进程,多个进程互不抢占CPU资源,可以同时进行,这种方式我们称之为并行(Parallel)。
决定并行的因素不是CPU的数量,而是CPU的核心数量,比如一个CPU多个核也可以并行。
1.2.3 并发 VS 并行
并发(Concurrency):指的是多个任务在同一个时间段内交替执行,通过时间片轮转、任务调度等方式实现任务间的切换。在并发执行中,任务之间可能会相互干扰,但是它们可以共享同一个处理单元。并发通常用于提高系统的资源利用率和响应能力。
并行(Parallelism):指的是多个任务同时在不同的处理单元上同时执行,每个处理单元都在独立地执行任务。并行可以通过多核处理器、分布式系统等实现。在并行执行中,任务之间不会相互干扰,它们可以同时进行,加快计算速度。并行通常用于提高计算能力和处理大规模数据的能力。
1.3 应用
1. 异步调用
同步:按照代码顺序执行,需要等待结果返回才能继续运行
异步:按照代码顺序执行,不需要等待结果返回就能继续运行
多线程可以让方法执行变为异步的。比如说读取磁盘文件时,假设读取操作花费了 5 秒钟,如果没有线程调度机制,这5秒cpu什么都做不了,其它代码都得暂停...
2. 提高效率
充分利用多核 cpu 的优势,提高运行效率。如果一个大的任务可以拆分为几个独立的小的任务,如A =a1+a2+a3,那么大任务A就可以拆分为三个小任务。
把这三个任务放在三个线程上执行,总的任务时间取决于耗时最长的小任务,而不是三个小任务运行时长的总和
1.单核 cpu 下,多线程不能实际提高程序运行效率,只是为了能够在不同的任务之间切换,不同线程轮流使用 cpu ,不至于一个线程总占用 cpu,别的线程没法干活
2. 多核 cpu 可以并行跑多个线程,但能否提高程序运行效率