一、数据依赖性
如果两个操作访问同一个变量,且两个操作中有一个为写操作,此时这两个操作就存在数据依赖性。数据依赖分为以下三种情况:
名称 | 代码示例 | 说 明 |
写后读 | a = 1; b = 2; | 写一个变量后,再读这个位置 |
写后写 | a = 1; a = 2; | 写一个变量后,再写这个变量 |
读后写 | a = b; b = 1; | 读一个变量之后,再写这个变量 |
上述三种情况,只要重排序两个操作的执行顺序,程序的执行结果就会改变。前面提到过,编译器和处理器可能会对操作进行重排序。编译器和处理器在重排序时,会遵循数据依赖性,编译器和处理不会改变存在数据依赖关系的两个操作的执行顺序。
这里说的数据依赖性仅针对单个处理器中执行的指令序列和单个线程中执行的操作,不同处理器和不同线程之间的数据依赖性不会被编译器和处理器考虑。
二、as-if-serial语义
as-if-serial语义的意思是:不管怎么重排序(编译器和处理器为了提高并行度),(单线程)程序的执行结果不能被改编。编译器、runtime和处理器都必须遵循as-if-serial语义。
为了遵循as-if-serial 语义,编译器和处理器不会对存在数据依赖的操作重排序,因为这种重排序会改变执行结果。但是如果操作之间不存在数据依赖关系,这些操作就可能被编译器和处理器重排序。
例如:
double pi = 3.14; //A
double r = 1.0; //B
double area = pi *r*r; //C
A和C之间存在数据依赖关系,同时B和C之间也存在数据以来关系。因此再最终执行的指令序列中,C不会被重排列到A和B的前面。但是A和B之间没有依赖关系,因此编译器和处理器可以重排序A和B之间的执行顺序。
as-if-serial语义把单线程程序保护了起来,遵守 as-if-serial语义的编译器、runtime和处理器共同为编写单线程程序的程序员创建了一个幻觉:单线程程序是按程序的顺序来执行的。as-if-serial 语义使单线程程序员无序担心重排序会干扰他们,也无需担心内存可见性问题。
三、程序顺序规则
根据happens -before的程序顺序规则,上面的计算圆的面积的示例嗲秒存在三个关系:
1、A happens- before B
2、B happens- before C
3、A happens- before C
这里A happens- before B,但是实际执行时B却可以排在A前边。即如果A happens- before B,JMM并不一定要求A要在B之前执行。JMM仅要求前一个操作对后一个操作可见,且前一个操作按照顺序排在第二个操作之前。这里A的执行结果不需要对B可见,因此A和B可以进行重排序。这种情况下,JMM会认为这种重排序不非法,JMM允许这种重排序。
在计算机中,软件技术和硬件技术有一个共同的目标:在不改变程序执行结果的前提下,尽量提高并行度。
四、重排序对多线程的影响
先看下面这段代码:假设有线程A先给a赋值,然后线程B在计算i的值
package test1;
public class Test implements Runnable{
private static int a;
private static boolean flag;
private int f;
public Test(int f1) {
// TODO Auto-generated constructor stub
this.f = f1;
}
@Override
public void run() {
// TODO Auto-generated method stub
if(f == 1){
a = 1;
flag = true;
}
if(f == -1){
int i = 0;
if(flag)
i = a*a;
System.out.println(i);
}
}
public static void main(String[] args) {
Test tt = new Test(1);
Test tt1 = new Test(-1);
Thread t1 = new Thread(tt);
Thread t2 = new Thread(tt1);
t1.start();
t2.start();
}
}
结果:一会是1一会是0
执行过程如下图:
如上图所示,操作1和操作2做了重排序,在线程B在线程A写入a之前进行了的读取,因此读取的值为0,因此结果一会是0一会是1,因此多线程的语义被重排序破坏了!!!!
在程序中,操作3和操作4存在控制依赖关系。当代码中存在控制依赖时,会影响指令序列的并行度。为此,编译器会采用一种猜测执行来客服控制依赖对并行度的影响。拿上述实例说,处理器可以提前执行线程B读取a并计算a*a,然后把计算结果临时保存到一个名为冲排列缓冲区的硬件缓存中(这里是为了节省总线IO)。当操作3的判断条件为真时,将值写入变量中。如下图所示:
由此得出结论,在单线程中,对于存在控制依赖的操作做重排序,不会改变程序的执行结果;但是多线程,对存在控制依赖的操作做重排序,可能会改变程序的执行结果!!!!!