理解Java中volatile关键字的作用
存储器的层次结构
要理解volatile关键字的作用,得先了解计算机的存储结构
计算机的存储结构如下图所示:
L1缓分成两种,一种是指令缓存,一种是数据缓存。L2缓存和L3缓存不分指令和数据。
L1和L2缓在CPU每个核心中独有一份,L3 则是所有CPU核心共享的内存。
L1、L2、L3的越离CPU近就越小,速度也越快,越离CPU远,速度也越慢。
再往后面就是内存,内存的后面就是硬盘。
下面是一个多核CPU的架构图:
计算机在执行程序时,每条指令都是在CPU中执行的,而执行指令过程中,势必涉及到数据的读取和写入。由于程序运行过程中的临时数据是存放在主存(物理内存)当中的,这时就存在一-个问题,由于CPU执行速度很快,而从内存读取数据和向内存写入数据的过程跟CPU执行指令的速度比起来要慢的多,因此如果任何时候对数据的操作都要.通过和内存的交互来进行,会大大降低指令执行的速度。因此在CPU里面就有了(L1\L2\L3)高速缓存。
当程序在运行过程中,会将运算需要的数据从主存复制一份到CPU的高速缓存当中,那么CPU进行计算时就可以直接从它的高速缓存读取数据和向其中写入数据,当运算结束之后,再将高速缓存中的数据刷新到主存当中。
问题引入
观察下面这段代码,判断程序是否能正常打印 “Method end!”
public class VolatileTest {
private boolean flag = true;
public void test() {
System.out.println("Method begin..");
while (flag) {
System.out.println("Method end!");
}
}
public static void main(String[] args) {
VolatileTest volatileTest = new VolatileTest();
new Thread(volatileTest::test, "another").start();
try {
Thread.sleep(2000);
} catch (Exception e) {
e.printStackTrace();
}
volatileTest.flag = false;
}
}
可以发现程序永远不会打印 “Method end!”
在前面已经解释过,每个线程在运行过程中都有自己的高速内存,那么 another 线程在运行的时候,会将 flag 变量的值拷贝一份放在自己的高速内存当中。
那么当主线程更改了 flag 变量的值之后,another 线程由于不知道主线程对 flag 变量的更改,因此还会一直循环下去。
这就是著名的缓存一致性问题,可以用 volatile 关键字来解决。
volatile关键字
一旦一个共享变量(类的成员变量、类的静态成员变量)被volatile修饰之后,那么就具备了两层语义:
-
保证了不同线程对这个变量进行操作时的可见性,即一个线程修改了某个变量的值,这新值对其他线程来说是立即可见的。
-
禁止进行指令重排序(本文不讲)。
public class VolatileTest {
private volatile boolean flag = true;
public void test() {
System.out.println("Method begin..");
while (flag) {
}
System.out.println("Method end!");
}
public static void main(String[] args) {
VolatileTest volatileTest = new VolatileTest();
new Thread(volatileTest::test, "another").start();
try {
Thread.sleep(2000);
} catch (Exception e) {
e.printStackTrace();
}
volatileTest.flag = false;
}
}
上面代码用volatile 修饰之后就变得不一样了:
-
volatile 关键字会强制将修改的值立即写入主存;
-
使用volatile 关键字的话,当主线程进行修改时,会导致another线程的工作内存中缓存变量flag 的缓存行无效(反映到硬件层的话,就是CPU的L1或者L2缓存中对应的缓存行无效) ;
-
由于another线程的工作内存中缓存变量flag ;的缓存行无效,所以another线程再次读取变量flag的值时会去主存读取。
并发编程的三个问题
在并发编程中,通常有以下三个问题:原子性问题,可见性问题,有序性问题。
对于volatile关键字来说:
- 由上面分析可见可以解决可见性问题
- 通过禁止进行指令重排序一定程度上解决有序性问题
- 不能解决原子性问题