volatile可见性、有效性底层原理
CPU硬件的实现原理
volatile:主要通过汇编lock前缀指令,他会锁定这块内存区域的缓存(缓存行锁定)并写回到主内存
IA-32架构软件开发者手册对lock指令的解释:
- 会将当前处理器缓存行的数据
立即
写回到系统内存 - 这个写回内存的操作会引起其他cpu里缓存了该内存地址的数据无效(MSI协议)
cpu的assign操作对应汇编语言中的“add dword ptr [rsp],oh”
[rsp]:cpu中工作内存的寄存器
volatile在read之前是不会lock的,而是在store时lock,同步完成后unlock,unlock后才允许其他线程读取。
如果不lock,当多线程写操作时,可能会导致线程B store到write通过总线时,线程A感知到数据发生变化将工作内存数据作废从新read,此时线程B还没有write操作,有可能线程A read的值还是flag = false原始值
加锁要尽量控制范围小,即解决并发问题又提升并行程序的性能
volatile:可以保证可见性与有效性,但是不能保证原子性,保证原子性需要借助synchronized这样的锁机制
synchronized原子性
示例,执行此线程输出结果,多次执行发现运算结果小于等于10000;
public class Demo11 {
private static volatile int value = 0;
private static void getNext(){
value++;
}
/**
* synchronized 同步解决共享数据计算不一致问题
*
* 模仿公用变量多线程引起数据不一致,多个线程共享一个变量,
* 在字节码执行计算时(iadd、putfield、ireturn)可能出现问题
* 堆:线程所共享区域(value这个对象在共享区域)
* 实例化对象:在队列中
* 程序接收器:线程独享区域
* @param args
*/
public static void main (String[] args) throws InterruptedException {
// 10个线程每个线程循环1000次 value++,期待结果应该是10000
Thread[] threads = new Thread[10];
for (int i = 0; i < threads.length; i++) {
threads[i]= new Thread(new Runnable() {
@Override
public void run () {
for (int i1 = 0; i1 < 1000; i1++) {
getNext();
}
}
});
threads[i].start();
}
for (Thread thread : threads) {
// 等待线程执行结束
thread.join();
}
// 输出 计算的结果 实际小于等于10000
System.out.println(value+"----10000");
}
}
导致输出结果小于等于10000的原因如图,比如当线程A处理数据做+1运算时,store经过总线(MESI缓存一致性协议)后,线程B工作内存计算失效,将重新read,在read时,线程A还未做完write操作,这就导致,计算结果小于预计结果
修改代码 synchronized 即可解决
private static synchronized void getNext(){
value++;
}