1、计算机硬件的缓存一致性
由于计算机存储设备与处理器的运算速度有着几个数量级的差距,所以现代计算机不得不加入一层或者多层读写速度尽可能接近处理器运算速度的高速缓存(Cache)来作为处理器与内存之间的缓冲:将运算需要的数据复制到缓存中,让运算能够快速进行,当运算结束后再从缓存中同步回内存中,这样处理器就无需等待缓慢的内存读写了。
基于高速缓存的存储交互很好的解决了处理器与内存速度之间的矛盾,但它却引入了一个新的问题:缓存一致性(Cache Coherence)。在一个多路处理器系统中,每一个处理器都有自己的高速缓存,而它们又共享同一主内存(Main Memory),将可能导致各自的缓存数据不一致。为了解决一致性的问题,需要各个处理器访问缓存时遵循一定的协议,在读写时要根据协议来操作,这类协议也就通常所说的缓存一致性协议,例如:MSI、MESI(Illinois Protocol)、MOSI、Synapse、Firefly及Dragon Protocol等。
2、Java内存模型
《Java虚拟机规范》1 中曾经试图定义一种 “Java内存模型” 2(Java Memory Model,JMM)来屏蔽各种硬件和操作系统的内存访问差异,以实现让Java程序在各种平台下都能达到一致的内存访问效果。经过长时间的验证和修补,直至JDK5(实现了JSR-133 3)发布后,Java内存模型才终于成熟、完善。
2.1、主内存与工作内存
Java内存模型的主要目的是定义程序中各种变量的访问规则,即关注在虚拟机中把变量值存储到内存和从内存中取出变量值这样的底层细节。此处的变量(Variables)与Java编程中所说的变量有所区别,它包括了实例字段、静态字段和构成数组对象的元素,但是不包括局部变量与方法参数,因为后者时线程私有的 4 ,不会被共享,自然就不存在竞争问题。为了获得更好的执行效能,Java内存模型并没有限制执行引擎使用处理器的特定寄存器或缓存和主内存进行交互,也没有限制技术编译器是否要进行调整代码执行顺序这类优化措施。
Java内存模型规定了所有的变量都存储在主内存(Main Memory)中(此处的主内存与物理硬件中的主内存名字一样,两者可以类比,但物理上它仅仅是虚拟机内存的一部分)。每条线程还有自己的工作内存(Working Memory,可与处理器高速缓存类比),线程的工作内存中保存了该线程使用的变量的主存副本,线程对变量的所有操作(读取、赋值等)都必须在工作内存中进行,而不能直接写主内存中的数据。不同的线程之间也无法访问对方工作内存中的变量,线程间的变量值的传递需要通过主内存来完成,线程、主内存、工作内存三者的交互关系如图:
2.2、内存间的交互操作
关于主内存和工作内存之间的交互协议,即一个变量如何从主内存中拷贝到工作内存、如何从主内存同步回主内存这一类的实现细节,Java内存模型定义了以下8种操作来完成。Java虚拟机是现实必须保证下面提及的每一种操作都是原子的、不可再分的。
- lock(锁定):作用于主内存的变量,它把一个变量标识为线程独占状态。
- unlock(解锁):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。
- read(读取):作用于主内存的变量,它把一个变量的值从主内存传输到线程的工作内存中,以便随后的load动作使用。
- load(载入):作用于工作内存的变量,它把read操作从主内存得到的变量值放入工作内存的变量副本中。
- use(使用):作用于工作内存的变量,它把工作内存中一个变量的值传递给执行引擎,每当虚拟机遇到一个需要使用变量的值的字节码指令时将会执行这个操作。
- assign(赋值):作用于工作内存的变量,它把一个从执行引擎接受的值赋给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
- store(存储):作用于工作内存的变量,它把工作内存中的一个变量的值传送到主内存中,以便随后的write操作使用。
- write(写入):作用于主内存的变量,它把store操作从工作内存中得到的变量的值放入主内存的变量中。
如果要把一个变量从主内存拷贝到工作内存,那就要按顺序执行read和load操作,如果要把变量从工作内存同步回主内存,就要按顺序执行store和write操作。注意,Java内存模型只要求上述两个操作必须按照顺序执行,但不要求连续执行。也就是说read与load之间、store与write之间是可插入其他指令的。除此之外,Java内存模型还规定了在执行上述8种基本操作时须满足如下规则:
- 不允许read和load、store和write操作之一单独出现,即不允许一个变量从主内存读取了但工作内存不接受,或者工作内存发起回写了但主内存不接受的情况出现。
- 不允许一个线程丢弃它最近的assign操作,及变量在工作内存中改变之后必须把该变化同步回主内存中。
- 不允许一个线程无原因的(没有发生任何assign操作)把数据从线程的工作内存同步回主内存中。
- 一个新的变量只能在主内存中“诞生”,不允许在在工作内存中直接使用一个为被初始化的(load或assign)的变量,换句话说就是对一个变量实施use、store操作之前,必须先执行load和assign操作。
- 一个变量在同一时刻只允许一条线程对其进行lock操作,但lock操作可以被同一条线程重复执行多次,多次lock之后,只有执行相同次数的unlock操作,变量才会被解锁。
- 如果对一个变量执行lock操作,那将会清空工作内存中此变量的值,在执行引擎使用这个变量,需要重新执行load和assign操作以初始化变量的值。
- 如果一个变量事先没有被lock操作锁定,那就不允许对它进行unlock操作,也不允许去unlock一个被其他线程锁定的变量。
- 对一个变量执行unlock操作之前,必须先把此变量同步回主内存中(执行store、write操作)。
2.3、对于volatile变量的特殊规则
关键字volatile可以说是Java虚拟机提供的最轻量级的同步机制,Java内存模型为volatile专门定义了一些特殊的访问规则。当一个变量被定义成volatile之后,它将具备两项特性:第一个是保证此变量对所有线程的可见性,这里的“可见性”是指当一条线程修改了这个变量的值,新值对于其他线程来说时可以立即得知的。
关于volatile变量的可见性,经常被开发人员误解,会以为下面的描述是正确的:“volatile变量对所有的线程是可见的,对volatile变量所有的写操作都能立刻反映到其他线程之中。换句话说,volatile变量在各个线程中是一致的,所以基于volatile变量的运算在并发下是线程安全的”。这句话的论据没有错,但是由其论据并不能得出“基于volatile变量的运算在并发下是线程安全的”这样的结论。Java里面的运算并非原子操作,这导致volatile变量的运算在并发下一样是不安全的,如下面这段代码:
public class volatileTest {
public static volatile int race = 0;
public static void increase() {
race++;
}
private static final int THREADS_COUNT = 20;
public static void main(String[] args) {
Thread[] threads = new Thread[THREADS_COUNT];
for(int i =0; i < THREADS_COUNT; i++) {
threads[i] = new Thread(new Runable() {
@Override
public void run() {
for(int i = 0; i < 10000; i++) {
increase();
}
}
});
threads[i].start();
}
while(Thread.activeCount() > 1)
Thread.yeild();
System.out.println(race);
}
}
由于volatile变量只能保证可见性,在不符合以下两条原则的运算场景中,我们仍然要通过加锁(使用synchronized、java .util.concurrent中的锁或原子类)来保证原子性:
- 运算结果并不依赖变量的当前值,或者能够确保只有单一线程修改变量的值。
- 变量不需要与其他的状态变量共同参与不变约束。
使用volatile变量的第二个语义是禁止指令重排序优化,普通的变量仅会保证在该方法的执行过程中所有依赖赋值结果的的地方都能获取到正确的结果,而不能保证变量赋值操作的顺序与程序代码的执行顺序一致。因为在同一个线程的方法执行过程中无法感知到这点,这就是Java内存模型描述的所谓“线程内表现为串行的语义”(Within-Thread As-If-Serial Semantic)。最后再来看看Java内存模型中对volatile变量定义的特殊规则的定义。假定T表示一个线程,V和M分别表示两个volatile型变量,那么在进行read、load、assign、store和write操作时需要满足以下规则:
-
只有当线程T对变量V执行的前一个动作是load的时候,线程T才能对变量V执行use动作;并且,只有线程T对变量V执行的后一个动作是use的时候,线程T才能对变量V执行load动作。线程T对变量V的use动作可认为是和线程T对变量V的load、read动作相关联的且一起出现。
这条规则要求在工作内存中,每次使用V前都必须先从主内存刷新最新的值,用于保证能看见其他线程对变量V所做的修改。 -
只有线程T对变量V执行的前一个动作是assign的时候,线程T才能对变量V执行store动作;并且,只有当线程T对变量V执行的最后一个动作是store的时候,线程T才能对变量V执行assign动作。线程T对变量V的assign动作可认为是和线程T对变量V的store、write动作相关联的,必须连续且一起出现。
这条规则要求在工作内存中,每次修改V后都必须立刻同步回主内存中,用于保证其他线程能够看到自己对变量V所做的修改。 -
假定动作A是线程T对变量V实施的use或assign动作,假定F是和动作A相关联的load或store动作,假定动作P是和动作动作F相应的对变量V的read或write动作;与此类似,假定动作B是线程T对变量W实施的use或assign动作,假定动作G是和动作B相关联的read或store动作,假定Q是和动作G相应的对变量W的read或write动作。如果A先于B,那么P先于Q。
这条规则要求volatile修饰的变量不会被指令重排序优化,从而保证代码的执行顺序与程序的顺序相同。
2.4、针对long和double型变量的特殊规则
Java内存模型要求lock、unlock、read、load、assign、use、store、write这八种操作都具有原子性,但是对于64位的数据类型(long和double),在模型中特别定义了一条宽松的规定:允许虚拟机将没有被volatile修饰的64位数据的读写操作划分为两次32位的操作来进行,即允许虚拟机实现自行选择是否要保证64位数据类型的load、store、read和write这四个操作的原子性,这既是所谓的“long和double的非原子性协定”(Non-Atomic Treatment of double and long Variables)。
2.5、原子性、可见性与有序性
1、原子性(Atomicity)
由Java内存模型来直接保证原子性的变量操作包包括read、load、assign、use、store和write这六个,我们大致认为,基本数据类型的访问、读写都是具备原子性的(例外就是long和double的非原子性协定,了解即可,无需在意几乎不会发生的例外情况)。如果应用场景需要一个更大范围的原子性保证(经常会遇到),Java内存模型还提供了lock和unlock操作来满足这种需求,尽管虚拟机未把lock和unlock操作直接开放给用户使用,但是却提供了更高层次的字节码指令monitorenter和monitorexit来隐式地使用这两个操作。这两个字节码指令反映到Java代码中就是同步块——synchronized关键字,因此在synchronized块之间的操作也具备原子性。
2、可见性(Visibility)
可见性就是值当一个线程修改了共享变量的值时,其他线程能够立即得知这个修改。除了volatile关键字之外,Java还有两个关键字能实现可见性,他们是synchronized和final。同步块的可见性是由“对一个变量执行unlock之前,必须先把此变量同步回主内存中(执行store、write操作)”这条规则获得的。而final关键字的可见性是指:被final修饰的字段在构造器中一旦被初始化完成,并且构造器没有把“this”的引用传递出去(this引用逃逸是一件很危险的事情,其他线程有可能通过这个引用访问到“初始化了一半”的对象),那么在其他线程中就能看见final字段的值。
3、有序性
Java程序中天然的有序性可以总结为一句话:如果在本线程内观察,所有操作都是有序的;如果在一个线程中观察另一个线程,所有的操作都是无序的。前半句是指“线程内似表现为串行的语义”(Within-Thread As-If-Serial Semantic),后半句是指“指令重排序”现象和“工作内存与主内存同步延迟”现象。
Java语言提供了volatile和synchronized两个关键字来保证线程之间操作的有序性,volatile关键字本身包含了禁止指令重排序的语义,而synchronized则是由“一个变量在同一个时刻只允许一条线程对其进行lock操作”这条规则获得的,这个规则决定了只有同步一个锁的两个同步块只能串行进入。
2.6、先行发生原则
如果Java内存模型中所有的有序性都仅靠volatile和synchronized来完成,那么有很多操作都将会变得非常啰嗦,但是我们在编写Java并发代码的时候并没有察觉到这一点,这是因为Java语言中有一个“先行发生”(Happens-Before)的原则。这个原则非常重要,它是判断数据是否存在竞争,线程是否安全非常有用的手段。“先行发生”原则是Java内存模型中定义的两项操作之间的偏序关系,比如说操作A先行发生与操作B,其实就是说发生操作B之前,操作A产生的影响能被操作B观察到,“影响”也包括了内存中共享变量的值、发送了消息、调用了方法等。下面是一些Java内存模型“天然的”先行发生关系:
- 程序次序规则(Program Order Rule):在一个线程内,按照控制流顺序,书写在前面的操作先行发生于书写在后面的操作。注意,这里书哦的控制流顺序不是程序代码顺序,因为要考虑到分支、循环等结构。
- 管程锁定原则(Monitor Lock Rule):一个unlock操作先行发生于后面对同一个锁的lock操作。这里必须强调的是“同一个锁”,“后面”是指时间上的现后。
- volatile变量规则(Volatile Variable Rule):对一个volatile变量的写操作先行发生于后面对这个变量的读操作,这里的“后面”同样指的是时间上的先后。
- 线程启动规则(Thread Start Rule):Thread对象的start()方法先行发生于此线程的每一个动作。
- 线程终止规则(Thread Termination Rule):线程中的所有操作都先行发生于对此线程的终止检测,我们可以通过Thread :: join() 方法是否结束、Thread :: isAlive() 的返回值等手段检测线程是否已经终止执行。
- 线程中断规则(Thread Interruption Rule):对现场interrupt() 方法的调用先行发生于被中断线程的终止检测到中断事件的发生,可以通过Thread :: interrupted() 方法检测到是否有中断发生。
- 对象终结规则(Finalizer Rule):一个对象初始化完成(构造函数执行结束)先行发生于它的finalize() 方法的开始。
- 传递性(Transitivity):如果操作A先行发生于操作B,操作B先行发生于操作C,那就可以得出操作A先行发生于操作C的结论。
在《Java虚拟机规范》第二版及之前,专门有一章 “Threads and Locks” 来描述内存模型,后来由于这部分内容难以把握宽紧限度,被反复修正更新,从第3版(Java SE 7 版)开始索性被移出规范,独立以JSR形式维护。 ↩︎
这里说的内存模型都特指目前正在使用的,在JDK1.2之后建立起来并在JDK5中完善过的内存模型。 ↩︎
JSR-133 : Java Memory Model and Threads Specification Revision(Java内存模型和线程规范修订)。 ↩︎
注意区分概念:如果局部变量是一个reference类型,它引用的对象在Java堆中可被各个线程共享,但是reference本身在Java栈的局部变量表中是线程私有的。 ↩︎