Java关键字volatile

提纲

定义

语义上,volatile是表示易变的、不确定的。
功能上,是Java提供的最轻量级的同步机制。

前因:从CPU缓存架构类比JMM线程工作内存和主内存关系

要弄懂如何保证可见性的,请看下图,左侧是CPU的缓存架构图:

如下图是一些时间参考,可更加直观的感受到各个组件的访问速度。

因为CPU的执行速度和内存的读写速度,相差太大。
CPU完成操作后,如果要等到内存也执行完成再继续下一个操作的话,对CPU算力就是极大的浪费。所以为了匹配2者的速度差,引入了高速缓存。现在CPU一般都有3级缓存,其中一级缓存离CPU核最近,速度也最快,可分为指令缓存和数据缓存2部分;下面是二级缓存,一个CPU核心就配备一个一级缓存和二级缓存的,是私有的。而三级缓存则是共享的,再下面是数据总线和主内存。

如下图是CPU的基本信息:

引入了高速缓存,虽然能让CPU效率提升,但是也带来了缓存一致性问题。为了解决这个问题,有两种方案,一是通过总线锁实现强一致性;二是缓存一致性协议,目前大多数采用的是MESI缓存一致性协议。(这2个方案都是硬件级别的)
随着CPU技术的发展,在CPU硬件级别多是使用的第二种方式,因为锁住总线期间,其他CPU无法访问内存,导致性能下降

而对于Java并发环境下,多线程的共享数据一致性问题也是类似,Java内存模型参考上述的CPU缓存架构实现了自己的线程、工作内存和主内存的关系,如上图里的右侧部分。

总线锁

所谓总线锁就是使用处理器提供的一个LOCK#信号,当一个处理器在总线上输出此信号时,其他处理器的请求将被阻塞住,那么该处理器可以独占共享内存,从而保证操作的原子性。

缓存一致性协议MESI

MESI协议是当前最主流的缓存一致性协议,在MESI协议中,每个缓存行有4个状态,可用2个bit表示,它们分别是:

Modified(修改):数据有效,数据被修改了,和内存中数据不一致,数据只存在于本Cache中。  
Exclusive(独享):数据有效,数据和内存中的数据一致,数据只存在于本Cache中。  
Shared(共享):数据有效,数据和内存中的数据一致,数据存在多个Cache中。  
Invalid(无效):数据无效,一旦数据被标记为无效,那效果就等同于它从来没被加载到缓存中。

其详细状态转换如下:

特性

因为Java内存模型对volatile关键字的支持,使得volatile修饰的变量(实例字段、静态变量或者数组对象的元素,不包含局部变量,因为局部变量是线程私有的)具备了如下特性:

  • 多线程间的可见性
  • 有序性,禁止指令重排序
  • 不保证原子性,如volatile int i=1;i++;

volatile底层实现原理

volatile修饰的底层区别

首先通过如下一段DCL(double check lock)程序来比对一下有volatile和没有volatile修饰变量的在汇编指令上的区别:

public class VolatileSingleton {
    public static volatile VolatileSingleton instance;
    public static VolatileSingleton getInstance(){
        if(instance == null){
            synchronized(VolatileSingleton.class){
                if(instance== null){
                    instance = new VolatileSingleton();
                }
            }
        }
        return instance;
    }
    public static void main(String[] args) {
        VolatileSingleton.getInstance();
    }
}

通过加上如下虚拟机参数,可以只显示getInstance()方法的汇编指令:

# server模式运行
-server 
# 让虚拟机编译模式执行代码
-Xcomp 
# 使用hsdis来显示执行的汇编指令,不同平台的hsdis插件请自行查阅安装
-XX:+UnlockDiagnosticVMOptions 
-XX:+PrintAssembly
# 如下2个命令,只打印关心部分的汇编指令,如果不指定会打印很多其他方法的汇编,造成混乱
# 编译命令,不要内联编译getInstance方法
-XX:CompileCommand=dontinline,*VolatileSingleton.getInstance 
# 编译命令,只编译getInstance方法
-XX:CompileCommand=compileonly,*VolatileSingleton.getInstance 

最后将没有加volatile修饰的汇编指令保存到novolatile.txt,加了volatile的保存到volatile.txt,再使用idea的compare with 对比如下图:

会发现加了volatile的会多出一行 lock addl $0x0,(%rsp) 的汇编指令,这个指令是一个内存屏障。
指令lock addl $0x0,(%esp)是一个空操作,关键在于 lock 前缀,查询 IA32 手册,它的作用是使得本 CPU 的 Cache 写入了内存,该写入动作也会引起别的 CPU invalidate 其 Cache。所以通过这样一个空操作,可让前面 volatile 变量的修改对其他 CPU 立即可见。

volatile基于软内存屏障实现可见性和有序性

通过内存屏障指令lock,如果有修改,处理器会将该变量所在缓存行的数据会写到主内存,并使得其他CPU里该变量所在的缓存行失效,从而保证该变量的可见性。
而且内存屏障会保证后面的指令不会重排序到屏障前面,从而保证有序性。

可见性定义

对于共享变量a,当线程1修改a的值后,其他线程能立即知道这个修改,就说变量a对所有线程有可见性。

可见性例子
/**
 * volatile 可见性测试
 */
public class VolatileVisibilityTest {
    private static volatile boolean ready;
    private static int number;

    private static class ReaderThread extends Thread{
        @Override
        public void run() {
            while (!ready);
            System.out.println(number);
        }
    }
    public static void main(String[] args) throws InterruptedException {
        new ReaderThread().start();
        Thread.sleep(1000);
        number = 42;
        ready = true;
        Thread.sleep(10000);
    }
}
/**
 * 因为JMM保证了volatile变量ready的可见性,在main线程中修改为true;
 * ReaderThread线程能应用到这个修改,则while(!ready)循环得以跳过。
 * 则输出42,,10秒后退出程序。如果ready没有修饰为volatile,则没有可见性,线程Reader会陷入死循环,程序永远不会停止。
 */

volatile不保证原子性

比如复杂操作,i++;

/**
 * volatile不保证原子性
 * @Author: mango
 * @Date: 2022/7/4 11:32 下午
 */
public class VolatileNoAtomicTest {
    private static volatile int number = 0;

    static class AdderThread extends Thread{
        @Override
        public void run() {
            for(int i=0;i<10000;i++){
                number++;
            }
        }
    }

    public static void main(String[] args) throws InterruptedException {
        Thread t1 = new AdderThread();
        t1.start();
        Thread t2 = new AdderThread();
        t2.start();
        t1.join();
        t2.join();
        System.out.println(number);
    }
}
/**
 * 结果:
 * 有时候输出小于20000的值,说明number++无法保证原子性
 */

volatile优化

追加volatile变量的宽度为操作系统缓存行的宽度,一般为64字节。Java中对象的引用是4字节,LinkedTransferQueue会在每个入队元素的对象引用后填充60个字节,将元素补齐到64字节来提升并发下的入队和出队效率。使用追加到64字节的方式来填满高速缓冲区的缓存行,避免头接点和尾节点加载到同一个缓存行,使得头尾节点在修改时不会互相锁定。

不需要补齐到64字节的场景

  1. 系统的缓存行不是64字节的,有的是32字节。
  2. 共享变量不会被频繁的写。

参考文档

  • 书籍:葛一鸣 *《Java高并发程序设计第二版》
  • 网上文章:https://www.cnblogs.com/zhangxl1016/articles/16001715.html
  • 网上文章:https://blog.csdn.net/stackfuture/article/details/122252734
  • 网上文章:https://www.cnblogs.com/hbbbs/articles/12116286.html
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值