Java 内存模型 (JMM) 概览
理解内存不可见性,首先要了解 Java 内存模型 (Java Memory Model, JMM)。 JMM 并不是实际存在的内存结构,而是一种规范,它定义了 Java 程序中各个变量(线程共享变量)的访问规则,以及在 JVM 中将变量存储到内存和从内存中读取变量这样的底层细节。 JMM 主要解决的是由于多线程并发访问共享变量时,可能出现的原子性、可见性和有序性问题。
- 主内存 (Main Memory): 所有线程共享的内存区域,存储着所有变量的实例。
- 工作内存 (Working Memory): 每个线程都有自己的工作内存,存储着该线程使用的变量的副本。线程对变量的所有操作(读取、赋值等)都必须在工作内存中进行,而不能直接读写主内存中的变量。
- 线程间交互: 线程之间变量值的传递需要通过主内存来完成。 例如,线程 A 修改了一个共享变量的值,需要先将修改后的值刷新到主内存中,线程 B 才能从主内存中读取到这个新的值。
内存不可见性的根本原因:工作内存的存在
正是因为每个线程都有自己的工作内存,导致了内存不可见性的问题。 当一个线程修改了共享变量的值,仅仅是修改了其工作内存中的副本,而没有立即写回到主内存。 因此,其他线程无法立即看到这个修改,仍然使用自己工作内存中的旧值。
详细解释导致内存不可见性的因素:
-
CPU 缓存 (CPU Cache):
- 原理: 为了弥补 CPU 运算速度与主内存访问速度之间的巨大差距,现在的CPU 引入了多级缓存(L1、L2、L3 等)。 CPU 优先从缓存中读取数据,只有在缓存未命中时才访问主内存。
- 导致不可见性: 当线程 A 修改了共享变量,实际上是修改了其 CPU 缓存中的副本。 这个修改后的值何时写回主内存,是不确定的。 其他线程 B 可能从自己的 CPU 缓存中读取该变量,得到的是旧值。
- 多核 CPU 的影响: 在多核 CPU 架构中,每个 CPU 核心都有自己的 L1 和 L2 缓存,所有核心共享 L3 缓存。 这使得缓存不一致性问题更加复杂。
-
编译器优化 (Compiler Optimization):
- 原理: 编译器为了提高程序执行效率,可能会对代码进行优化,例如: