Java内存模型
前面讲解了内存模型的基本知识,本节主要对Java内存模型进行说明
在Java虚拟机规范中试图定义一种Java内存模型(Java Memory Model,JMM)来屏蔽不同硬件和操作系统的差异性,保证在各个平台下对内存的访问和操作都是一致的,实现了跨平台的功能。
那么JMM的中心思想是什么呢?简单通俗的定义了指令执行的顺序,为了保证cup高效有序的运行,JMM并没有做太多的限制,所以同样的也会存在缓存不一致和和重新排序的问题。
那么Java对于原子性、可见性和有序性做了那些要求?
原子性
在Java中,对基本数据类型的变量的读取和赋值操作是原子性操作,即这些操作是不可被中断的,要么执行,要么不执行。
举个例子说明一下
int i = 1;
i++;
i = i + 1;
int j = i;
以上四个是Java简单的赋值和运算语句,其中只有第一个是原子性的,其它三个都不是,为什么呢?
i = 1 是直接将变量 i 赋值1后写入内存的
i++ 和 i=i+1 这两个其实执行了三步,首先从内存读取i的值,然后对i加1,最后在将i的值会刷到内存
j = i 首先从内存中读取i的值,然后赋值给j,然后在将j的值回写入内存,随时都是从内存中读取,写入内存,但两个合起来就不具备原子性了
总结一下就是,只有简单的读取、赋值(而且必须是将数字赋值给某个变量,变量之间的相互赋值不是原子操作)才是原子操作。
不过这里有一点需要注意:在32位平台下,对64位数据的读取和赋值是需要通过两个操作来完成的,不能保证其原子性。但是好像在最新的JDK中,JVM已经保证对64位数据的读取和赋值也是原子性操作了。
从上面可以看出,Java内存模型只保证了基本读取和赋值是原子性操作,如果要实现更大范围操作的原子性,可以通过synchronized和Lock来实现。由于synchronized和Lock能够保证任一时刻只有一个线程执行该代码块,那么自然就不存在原子性问题了,从而保证了原子性。
可见性
Java提供了volatile关键字执行共享变量的可见性
如果有线程修改了被volatile修饰的变量,那么该变量会将修改后的值立刻回写入内存,保证内存中的变量值是最新的
对于普通变量来说,线程修改后的新值还是会存在高速缓存中,只有会写入内存后才能被其它线程看到
除了volatile关键字外,synchronized和lock也可以实现可见性,synchronized关键字修饰的代码块同一时间只能被一个线程使用,如果线程修改了代码块中的数据,也会立刻回写入内存中
有序性
在Java内存模型中,允许编译器和处理器对指令进行重排序,但是重排序过程不会影响到单线程程序的执行,却会影响到多线程并发执行的正确性。
在Java里面,可以通过volatile关键字来保证一定的“有序性”(具体原理在下一节讲述)。另外可以通过synchronized和Lock来保证有序性,很显然,synchronized和Lock保证每个时刻是有一个线程执行同步代码,相当于是让线程顺序执行同步代码,自然就保证了有序性。
另外,Java内存模型具备一些先天的“有序性”,即不需要通过任何手段就能够得到保证的有序性,这个通常也称为 happens-before 原则。如果两个操作的执行次序无法从happens-before原则推导出来,那么它们就不能保证它们的有序性,虚拟机可以随意地对它们进行重排序。
下面就来具体介绍下happens-before原则(先行发生原则):
程序次序规则:一个线程内,按照代码顺序,书写在前面的操作先行发生于书写在后面的操作
锁定规则:一个unLock操作先行发生于后面对同一个锁额lock操作
volatile变量规则:对一个变量的写操作先行发生于后面对这个变量的读操作
传递规则:如果操作A先行发生于操作B,而操作B又先行发生于操作C,则可以得出操作A先行发生于操作C
线程启动规则:Thread对象的start()方法先行发生于此线程的每个一个动作
线程中断规则:对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生
线程终结规则:线程中所有的操作都先行发生于线程的终止检测,我们可以通过Thread.join()方法结束、Thread.isAlive()的返回值手段检测到线程已经终止执行
对象终结规则:一个对象的初始化完成先行发生于他的finalize()方法的开始
这8条原则摘自《深入理解Java虚拟机》。
这8条规则中,前4条规则是比较重要的,后4条规则都是显而易见的。
下面我们来解释一下前4条规则:
对于程序次序规则来说,我的理解就是一段程序代码的执行在单个线程中看起来是有序的。注意,虽然这条规则中提到“书写在前面的操作先行发生于书写在后面的操作”,这个应该是程序看起来执行的顺序是按照代码顺序执行的,因为虚拟机可能会对程序代码进行指令重排序。虽然进行重排序,但是最终执行的结果是与程序顺序执行的结果一致的,它只会对不存在数据依赖性的指令进行重排序。因此,在单个线程中,程序执行看起来是有序执行的,这一点要注意理解。事实上,这个规则是用来保证程序在单线程中执行结果的正确性,但无法保证程序在多线程中执行的正确性。
第二条规则也比较容易理解,也就是说无论在单线程中还是多线程中,同一个锁如果出于被锁定的状态,那么必须先对锁进行了释放操作,后面才能继续进行lock操作。
第三条规则是一条比较重要的规则,也是后文将要重点讲述的内容。直观地解释就是,如果一个线程先去写一个变量,然后一个线程去进行读取,那么写入操作肯定会先行发生于读操作。
第四条规则实际上就是体现happens-before原则具备传递性。