首先我们来解释为什么会有可见性问题:简单来说就是每个线程都含有各自的多层缓存,共享一个主内存。对变量的操作是在工作内存中完成的,所以各个线程不清楚其他线程的具体操作,比如A线程修改变量a=10,修改完后只是放在A线程的工作内存中,而B线程的工作内存中变量a为原值,这也就是所谓的可见性问题。
java内存模型(java memory model)将下图的L1 cache、L2 cache等视为工作内存,而L3 cache、RAM视为主内存。注意这里的registers(寄存器),它是完成具体变量操作的地方。
所以大家就记住,有三个存储数据的地方:寄存器,工作内存和主内存。其中寄存器和工作内存为线程私有。
接着我们说明volatile的工作原理:
第一:使用volatile关键字会强制将修改的值立即写入主存;
第二:使用volatile关键字的话,当线程1进行修改时,会导致其他所有线程的工作内存中缓存变量XXX的缓存行无效。
第三:由于线程1的工作内存中缓存变量XXX的缓存行无效,所以线程1再次读取变量XXX的值时会去主存读取。
然后我们来看一段代码:
public class Test {
public volatile int a = 0;
public void increase() {
a++;
}
public static void main(String[] args) {
final Test test = new Test();
for(int i=0;i<10;i++){
new Thread(){
public void run() {
for(int j=0;j<1000;j++)
test.increase();
};
}.start();
}
while(Thread.activeCount()>1) //保证前面的线程都执行完
Thread.yield();
System.out.println(test.a);
}
}
这段代码很简单,就是让多个线程同时执行a++的操作。a++这个操作实际上由三方面组成:读取a变量,a+1,写回到工作内存。
考虑这样一种情况:
A线程运行时,读取到a=10,a+1,完成了前两步。此时A线程的内存模型中:寄存器里a=11,工作内存a=10。
接着切换到了B线程,B线程读取a=10,a+1,写回到工作内存(直接完成三步)。因为volatile会导致其他所有线程的工作内存中缓存变量XXX的缓存行失效,也就是使得所有线程的工作内存a变为11。
此时A线程的内存模型中:寄存器里a=11,工作内存a=11,B线程的内存模型中:寄存器里a=11,工作内存a=11,主内存a=11。
最后切回到A线程,还剩下最后一步,写回到工作内存,也就是将寄存器里的值赋给工作内存和主内存,a仍然为11。这也就是为什么两个线程执行a++的操作,却只加了一次1。
我认为最关键的点在于:1.明确volatile的原理,2.了解线程的内存模型(千万不要忘记了寄存器的存在)
记住一句话,使用volatile修饰的变量a,那么所有线程工作内存中的a在何时何地都是一致的!