Java内存模型

最新推荐文章于 2024-09-07 12:59:11 发布

荆轲刺秦

最新推荐文章于 2024-09-07 12:59:11 发布

阅读量379

点赞数 1

分类专栏： JVM 文章标签：多线程 java jvm Java内存模型

本文链接：https://blog.csdn.net/ai_xao/article/details/103708852

版权

JVM 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

文章目录

写在前面

本文作为阅读了周志明作者的 <<深入理解Java虚拟机>> 的读书笔记。由于个人理解有限，本文摘抄的内容可能比较片面，强烈建议入手本书！本文也参考了 Java 虚拟机官方文档。

解决的问题：屏蔽掉各种硬件和操作系统的内存访问差异，以实现让 Java 程序在各种平台下都能达到一致的并发效果。

主要目标：定义程序中各个变量的访问规则，即在虚拟机中将变量存储到内存和从内存中取出变量这样的底层细节。

此处的变量（其实指的是共享变量）与 Java 编程中所说的变量略有区别，它包括了实例字段、静态字段和构造数组对象的元素，但是不包括局部变量与方法参数，因为后者是线程私有的，不会被共享。

主内存与工作内存

Java 内存模型规定所有的变量都存储在主内存中，每条线程拥有自己的工作内存，工作内存中保存了该线程使用到的变量的主内存副本拷贝，线程对变量的所有操作（读取、赋值等）都必须在工作内存中进行，而不能直接读写主内存中的变量。不同的线程之间也无法直接访问对方工作内存中的变量，线程间变量值的传递需要通过主内存来完成。

Java 内存模型

我：这样的描述应该算通俗易懂了。有趣的一点是，Java 文档中对于内存模型的描述并没有在 JVM 规范中，而是放在了 Java 语言规范中。Java 语言规范中对其的描述比较晦涩，并且更偏语义，也不触及底层实现。

下面给出官方的定义（已翻译）：

内存模型描述给定一个程序和程序执行栈，该执行栈是否为程序的合法执行。Java 编程语言内存模型的工作原理是检查执行栈中的每个读，并根据某些规则检查读观察到的写是否有效。

内存模型决定在程序的每个点可以读取哪些值。在隔离状态下，每个线程的操作必须由该线程的语义控制，但是每个读操作看到的值由内存模型决定。

看一下下面这个例子：

// 局部变量 r1 r2, 共享变量 A B，初始化 A = B = 0

// 线程 1               // 线程 2
r2 = A;        			 r1 = B;
B = 1;        			 A = 2;

出现 r2 = 2 和 r1 = 1 的结果看似是不可能的。但是不影响线程的执行，编译器可以对指令进行重新排序：

// 局部变量 r1 r2, 共享变量 A B，初始化 A = B = 0

// 线程 1               // 线程 2
B = 1;                 r1 = B;
r2 = A;         	   A = 2;

在这种情况下， r2 = 2 和 r1 = 1 的结果看起来是合理的。该程序本身是一个线程不安全的程序，存在对共享变量的读写。如果想确保它的有序性，则需要 Java 内存模型中的 synchronized 来保证（在读了后续的原子性，你将会明白为什么这样说）。

内存间交互操作

一个变量如何从主内存拷贝到工作内存、如何从工作内存同步回主内存的实现细节，Java 内存模型中定义了以下八种操作来完成（每一种操作都是原子的，不可再分的）：

lock（锁定）：作用于主内存的变量，它把一个变量标识为一条线程独占的状态。
unlock（解锁）：作用于主内存的变量，它把一个处于锁定状态的变量释放，释放后的变量才可以被其他线程锁定。
read（读取）：作用于主内存的变量，它把一个变量的值从主内存传输到线程的工作内存中，以便随后的 load 动作使用。
load（载入）：作用于工作内存的变量，它把 read 操作从主内存中得到的变量值放入工作内存的变量副本中。
use（使用）：作用于工作内存的变量，它把工作内存中一个变量的值传递给执行引擎，每当虚拟机遇到一个需要使用到变量的值的字节码指令时，将会执行这个操作。
assign（赋值）：作用于工作内存的变量，它把一个从执行引擎收到的值赋值给工作内存的变量，每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
store（存储）：作用于工作内存的变量，它把工作内存中一个变量的值传送到主内存中，以便随后的 write 操作使用。
write（写入）：作用于主内存的变量，它把 store 操作从工作内存中得到的变量的值放入主内存的变量中。

如果一个变量从主内存复制到工作内存，那就要按顺序（注意：并不是连续）地执行 read 和 load 操作，如果要把变量从工作内存同步回主内存，就要按顺序地执行 store 和 write 操作。

对于 volatile 型变量的特殊规则

volatile 可以说是 Java 虚拟机提供的最轻量级的同步机制。也就是说，如果能够正确地理解 volatile ，就不用每次在遇到多线程竞争的问题就一律使用 synchronized 来进行同步。

当一个变量被定义成 volatile 后，它将具备两种特性：

内存可见性：保证此变量对于所有线程的可见性，也就是说当一条线程修改了这个变量的值，新值对于其他线程来说是可以立即得知的。
禁止指令重排序优化：就像前面所给的例子一样，编译器会进行优化，对指令进行重排序，而 volatile 则能禁止这种行为。

对于 long 和 double 型变量的特殊规则

Java 内存模型要求 lock、unlock、read、load、use、assign、store 和 write 这八个操作都具有原子性。但对于 64 位的数据类型（long 和 double），允许虚拟机将没有被 volatile 修饰的 64 位数据的读写操作划分为两次32的操作来进行。也就是说多个线程共享一个未声明为 volatile 的 long 和 double 类型的变量，并且同时对它们进行读取和修改操作，那么某些线程可能会读取到一个既非原值，也不是其它线程修改的值。

不过这种情况很罕见，因为大多数商用虚拟机几乎都选择了把 64 位数据的读写操作作为原子操作来对待，因此在编写代码时，一般不需要将用到的 long 和 double 变量专门声明为 volatile。

原子性、可见性与有序性

Java 内存模型是围绕着在并发过程中如何处理原子性、可见性和有序性这三个特征来建立的，逐个看一下哪些操作实现了这三个特性。

原子性：Java 内存模型直接保证原子性变量操作（read、load、use、assign、store、write）这六个，大致可以认为基本数据类型的访问读写是具备原子性的。如果应用场景需要更大范围的原子性保证，Java 内存模型提供了 lock 和 unlock 操作来满足这种需求。

lock 和 unlock 虽然未直接开放给用户使用，但是却提供了更高层次的字节码指令 monitorenter 和 monitorexit 来隐式地使用这两个操作，反映到 Java 代码中就是同步块-synchronized 关键字。
可见性：可见性是指当一个线程修改了共享变量的值，其他线程能够立即得知这个修改。volatile 的特殊规则保证了新值能立即同步到主内存，以及每次使用前从主内存刷新。synchronize 和 final 关键字也能实现可见性。

final 关键字的可见性是指：被 final 修饰的字段在构造器中一旦被初始化完成，那么在其他线程中就能看见 final 字段的值，它们无需同步就能被其他线程正确地访问。
有序性：如果在本线程内观察，所有的操作都是有序的（线程内表现为串行的语义）；如果在一个线程中观察另一个线程，所有的操作都是无序的（指令重排序和工作内存与主内存同步延迟现象）。

volatile 和 synchronized 两个关键字来保证线程之间操作的有序性，volatile 关键字本身就包含了禁止指令重排的语义，而 synchronized 则决定了同一个锁的同步块只能串行地进入。

先行发生原则

如果 Java 内存模型中所有的有序性都只能靠 volatile 和 synchronized 来完成，那么有一些操作就会变得啰嗦，先行发生原则能够判断数据是否存在竞争，线程是否安全，依赖这个原则，我们可以通过几条规则解决并发环境下两个操作是否可能存在冲突的所有问题。

先行发生是 Java 内存模型中定义的两项操作之间的偏序关系，如果说操作 A 先行发生于操作 B，其实就是说在发生操作 B 之前，操作 A 产生的影响能被操作 B 观察到。

程序次序规则：在一个线程内，按照控制流顺序，书写在前面的操作先行发生于书写在后面的操作。
管程锁定规则：一个 unlock 操作先行发生于后面对同一个锁的 lock 操作。“后面” 是指时间上的先后顺序。
volatile 变量规则：对一个 volatile 变量的写操作先行发生于后面对这个变量的读操作。
线程启动规则：Thread 对象的 start 方法先行发生于此线程的每一个动作。
线程终止规则：线程中的所有操作都先行发生于对此线程的终止检测，

可以通过 Thread.join 方法结束，通过 Thread.isAlive 的返回值检测线程是否终止执行。
线程中断规则：对线程 interrupt 方法的调用先行发生于被中断线程的代码检测到中断事件的发生。
对象终结规则：一个对象的初始化完成先行发生于它的 finalize 方法的开始。
传递性：如果操作 A 先行发生于操作 B，操作 B 先行发生于操作 C，那么操作 A 先行发生于操作 C 的结论。