关键字volatile是Java虚拟机提供的最轻量级的同步机制。在Java API应用层,对volatile关键字的描述是具备以下两个特点:
(1)保证此变量对所有线程的可见性,这里的“可见性”是指当一条线程修改了这个变量的值,新值对于其它线程来说是立即得知的。
(2)禁止指令重排序优化。
那么虚拟机是如何实现volatile关键字这两条特性的呢?这首先要从Java内存模型说起。
Java内存模型的主要目标是定义程序中各个变量的访问规则,即在虚拟机中将变量存储到内存和从内存中取出变量这样的底层细节。此处的变量与Java编程中所说的变量有所区别,它包括了实例字段、静态字段和构成数组对象的元素,但不包括局部变量与方法参数,因为后者是线程私有的,不会被共享,自然就不会存在竞争问题。
Java内存模型规定了所有的变量都存储在主内存中(此处的主内存与物理硬件的主内存名字一样,两者可以互相类比,但此处仅是虚拟机内存的一部分)。每条线程还有自己的工作内存(可与处理器的高速缓存类比),线程的工作内存中保存了被该线程使用到的变量的主内存副本拷贝,线程对变量的所有操作(读取、赋值等)都必须在工作内存中进行,而不能直接读写主内存中的变量。不同的线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成,线程、主内存、工作内存三者的交互关系如下图所示。
那主内存与工作内存之间又是如何传递数据的呢?Java内存模型中定义了以下8种操作来完成,下面的每一种操作都是原子的、不可再分的。
(1)lock:作用于主内存的变量,它把一个变量标识为一条线程独占的状态。
(2)unlock:作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才可以被其它线程锁定。
(3)read:作用于主内存的变量,它把一个变量的值从主内存传输到线程的工作内存中,以便随后的load动作使用。
(4)load:作用于工作内存的变量,它把read操作从主内存中得到的变量值放入工作内存的变量副本中。
(5)use:作用于工作内存的变量,它把工作内存中一个变量的值传递给执行引擎,每当虚拟机遇到一个需要使用到变量的值的字节码指令时都会执行这个操作。
(6)assign:作用于工作内存的变量,它把一个从执行引擎接收到的值赋给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
(7)store:作用于工作内存的变量,它把工作内存中一个变量的值传送到主内存中,以便随后的write使用。
(8)write:作用于主内存的变量,它把store操作从工作内存中得到的变量的值放入主内存的变量中。
Java虚拟机对volatile关键字特性的支持,是由于Java内存模型中对volatile变量定义的特殊规则。假设T表示一个线程,V和W分别表示两个volatile型变量,那么在进行read、load、use、assign、store和write操作时满足如下规则:
(1) 线程T对变量V的use动作可以认为是和线程T对变量V的load、read动作相关联,必须连续一起出现(这条规则要求在工作内存中,每次使用V前都必须先从主内存刷新最新的值,用于保证能看见其它线程对变量V所做的修改后的值)。
(2) 线程T对变量V的assign动作可以认为是和线程T对变量V的store、write动作相关联,必须连续一起出现(这条规则要求在工作内存中,每次修改V后都必须立刻同步回主内存中,用于保证其它线程可以看到自己对变量V所做的修改)。
(3) 假定动作A是线程T对变量V实施的use或assign动作,假定动作F是和动作A相关联的load或store动作,假定动作P是和动作F相应的对变量V的read或write动作;类似的,假定动作B是线程T对变量W实施的use或assign动作,假定动作G是和动作B相关联的load或store动作,假定动作Q是和动作G相应的对变量W的read或write动作。如果A优于B,那么P先于Q(这条规则要求volatile修饰的变量不会被指令重排序优化,保证代码的执行顺序与程序的顺序相同)。