写在前面
本文作为阅读了周志明作者的 <<深入理解Java虚拟机>> 的读书笔记。由于个人理解有限,本文摘抄的内容可能比较片面,强烈建议入手本书!
线程作为比进程更轻量级的调度执行单位,线程的引入,可以把进程的资源分配和执行调度分开,各个线程可以共享进程资源(内存地址、文件 I/O 等),又可以独立调度(线程是 CPU 调度的最基本单位)。
线程的实现
主流的操作系统都提供了线程实现,Java 语言则提供了在不同硬件和操作系统平台下对线程操作的统一处理。
实现线程的三种方式:使用内核线程实现,使用用户线程实现,使用用户线程加轻量级进程混合实现。
用户态和内核态是 CPU 权限等级的一种划分,限制不同程序之间的访问能力。也就是说对于一些特权指令,用户态无权执行;必须通过系统调用时,将运行模式从用户级转换为内核级,此时进程在内核的地址空间中运行。
-
使用内核线程实现
内核线程是直接由操作系统内核支持的线程,这种线程是由内核来完成切换,内核通过操纵调度器对线程进行调度,并负责将线程的任务映射到各个处理器上。每个内核线程都可以看做是内核的一个分身,这样操作系统就有能力同时处理多件事件。
程序一般不会去直接使用内核线程,而是通过内核线程的一种高级接口-轻量级进程(Light Weight Process) ,轻量级进程则是我们通常意义上所讲的线程,每个轻量级进程都由一个内核线程支持。
轻量级进程的局限性在于它的各种进程操作都需要进行系统调用,而系统调用的代价相对较高,需要在用户态和内核态中来回切换。
-
使用用户线程实现
从广义上来讲,一个线程只要不是内核线程,那么就可以认为它是用户线程,所以呢,轻量级进程也可以算作用户线程,但轻量级进程的实现是建立在内核之上的,许多操作需要进行系统调用,效率会受到限制。
从狭义上来讲,用户线程指的是完全建立在用户空间中的,系统内核不能感知到线程存在的实现,用户线程的建立、同步、销毁和调度完全在用户态中完成,不需要内核的帮助。如果程序实现得当,这种线程就不需要切换到内核态,因此操作是非常快速且低消耗的,这种进程与用户线程之间
1:N
的关系称为一对多线程模型。由于没了内核的支援,所有的线程操作都需要用户程序自己处理。线程的创建、切换和调度都是需要考虑的问题,由于系统只把处理器资源分配到进程,那诸如“ 阻塞如何处理”, “多处理器中如何将线程映射到其它处理器上” 这类问题解决起来将会异常困难。由于用户线程的实现比较复杂,像 Java 都曾经使用过,但到最后也都放弃了。
-
使用用户线程加轻量级进程混合实现
既存在用户线程,又存在轻量级进程。用户线程还是完全建立在用户空间中,因此用户线程的创建、切换、析构等操作依然廉价。而操作系统提供的轻量级进程则为用户线程和内核线程之间的桥梁,这样可以使用内核提供的线程调度功能及处理器映射。
在这种混合模式中,用户线程和轻量级进程数量比是不定的,这就是多对多线程模型。
Java 线程的实现
Java 线程在 JDK 1.2
之前,是基于名为 ”绿色线程" 的用户线程实现的,而在 JDK 1.2
中,线程模型被替换为基于操作系统原生线程模型来实现。因此,在目前的 JDK
版本版本中,操作系统支持怎样的线程模型,在很大程度上就决定了 Java
虚拟机的线程是怎样映射的。
线程模型只对线程的并发规模和操作成本产生影响,对 Java 程序的编码和运行过程来说,这些差异都是透明的。
线程的调度
线程调度是指系统为线程分配处理器使用权的过程,主要调度方式有两种,分别是协同式线程调度和抢占式线程调度。
协同式线程调度由线程自身控制执行时间,线程自己的工作执行完之后,再主动通知系统切换到另外一个线程上去。协同式多线程的最大好处是实现简单,坏处也很明显:线程执行时间不可控,如果一个线程编写有问题,一直不告知系统进行线程切换,那么程序就会一直阻塞在那里。
抢占式调度则由操作系统来分配执行时间,线程的切换不由线程本身来决定。Java 使用的线程调度方式就是抢占式调度。
在 Java 中,
Thread.yield()
可以让出执行时间,但是要获取执行执行时间的话,线程本身是没有什么办法的。
状态转换
Java 语言定义了5种进程状态,在任意一个时间点中,一个进程只能有且只有其中的一种状态,这 5 种状态分别是:
对,你没有看错,这里确实是写的进程,我查找了
JAVA
语言规范和JVM
规范,但并没有找到相关资料。
-
新建:创建后尚未启动的线程
-
运行:处于此状态的线程有可能正在执行,也有可能正在等待着 CPU 为它分配执行时间。
-
无限期等待:不会被 CPU 分配执行时间,需要等待被其它线程显示地唤醒。
Object.wait(); Thread.join(); LockSupport.park();
-
限期等待:不会被 CPU 分配执行时间,也不一定非要被其它线程显示地唤醒,在一定时间后,它们会由系统自动唤醒。
Thread.sleep(); 设置了时间的 Object.wait() 和 Thread.join() 方法;LockSupport.parkNanos(); LockSupportparkUntil();
-
阻塞:进程被阻塞了,等待着获取到一个排它锁。在程序等待进入同步区域的时候,线程将进入这种状态。
-
结束:已终止线程的线程状态,线程已经结束执行。
总结
从操作系统的线程实现,再到 Java 线程的实现,总的来说,有前者的因,才有了后者的果。因为 Java 本身在面向开放者时需要屏蔽底层细节,可是操作系统在线程的实现上又各不相同,这就到导致了 Thread 的很多关键方法是采用了原生方法实现的,当然,也可能是为了更高的效率。
我与风来
认认真真学习,做思想的产出者,而不是文字的搬运工
错误之处,还望指出