【JUC】JMM(Java Memory Model,Java内存模型)

面试题

  • 你知道什么是Java内存模型JMM吗?
  • JMM和volatile他们两个之间的关系?
  • JMM有哪些特征或者它的三大特征是什么?
  • 为什么要有JMM,它为什么出现?作用和功能是什么?
  • happens-before先行并发原则你有了解过吗?

计算机硬件存储体系

  • 计算机存储结构,从本地磁盘到主存到CPU缓存,也就是从硬盘到内存到CPU。一般对应的程序操作就是从数据库查数据到内存然后到CPU进行计算。
  • CPU的运行并不是直接操作内存而是先把内存里面的数据读到缓存。内存的读和写操作的时候会造成不一致的问题。CPU和内存的速度是不一致的,CPU速度远快于内存,CPU运算出来的东西先放在高速缓存中,再让高速缓存和内存进行沟通。

在这里插入图片描述

  • JVM规范中试图定义一种Java内存模型来屏蔽掉各种硬件和操作系统的内存访问差异,以实现让Java程序在各种平台(Win、Mac、Linux)下都能达到一致性的内存访问效果。

在这里插入图片描述

JMM定义

JMM(Java内存模型Java Memory Model)本身是一种抽象的概念并不真实存在,它仅仅描述的是一组约定或规范,通过这组规范定义了程序中(尤其是多线程)各个变量的读写访问方式并决定一个线程对共享变量的写入以及如何变成对另一个线程可见

原则:

关键技术点都是围绕多线程的原子性、可见性和有序性展开的

能干嘛?

  • 通过JMM来实现线程和主内存之间的抽象关系
  • 屏蔽各个硬件平台和操作系统的内存访问差异,实现让Java程序在各种平台下都能达到一致性的内存访问效果

JMM规范三大特性

可见性

可见性是指当一个线程修改了某一个共享变量的值,其他线程是否能够立即知道该变更,JMM规定了所有的变量都存储在主内存中。

在这里插入图片描述

  • 系统中主内存共享变量数据修改被写入的时机是不确定的,多线程并发下很可能出现“脏读”(当前读到的数据不一定是最新的,其他线程可能已经修改过了),所以每个线程都有自己的工作内存,线程自己的工作内存中保存了该线程使用到的变量的主内存副本拷贝,线程对变量的所有操作(读取、赋值等)都必须在线程自己的工作内存中进行,而不能够直接写入主内存中的变量,不同线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成。例如:主内存中有一个小狗对象,小狗有年龄这个属性,存储在主内存中。如果线程A想要修改小狗的年龄,需要将该数据加载到自己的工作内存中,修改之后,再提交到主内存中,其他线程再去主内存中读取才能获得最新值

在这里插入图片描述

如果没有可见性,会产生线程脏读问题

  • 主内存中有变量X,初始值为0
  • 线程A要将X加1,先将X=0拷贝到自己的私有内存中,然后更新X的值
  • 线程A将更新后的X值回刷到主内存的时间是不固定的
  • 刚好在线程A没有回刷x到主内存时,线程B同样从主内存中读取X,此时为0,和线程A一样的操作
  • 最后期盼的X=2(A线程+1,B线程+1)就会变成X=1(因为不可见,两个线程各自从0加1)

解决方案:保证数据修改的时候,只有一个线程来改,线程A修改完数据之后,要及时将内存更新回到主内存中,并通知其他线程去主内存中获取最新数据

原子性

**原子性:**指一个操作是不可被打断的,即在多线程环境下,当前线程的操作不能被其他线程干扰

有序性

有序性:对于一个线程的执行代码而言,代码的执行并不总是从上到下,有序执行。为了提升性能,编译器和处理器通常会对指令序列进行重新排序。Java规范规定JVM线程内部维持顺序化语义,即只要程序的最终结果与它顺序话执行的结果相等,那么指令的执行顺序可以与代码顺序不一致,此过程叫指令的重排序

重排序优缺点

  • 优:JVM能根据处理器特性(CPU多级缓存系统、多核处理器等)适当的对机器指令进行重排序,使机器指令更符合CPU的执行特性,最大限度的发挥机器性能。
  • 缺:指令重排可以保证串行语义一致,但没有义务保证多线程的语义也一致(即可能产生“脏读”),简单而言就是两行以上不相干的代码在执行的时候有可能先执行的不是第一条,不见得是从上到下顺序执行,执行顺序会被优化。多线程环境中线程交替执行,由于编译器优化重排的存在,两个线程使用的变量能否保证一致性是无法确定的,结果无法预测。(有时候场景业务需要我们禁止指令重排,保证程序执行的有序性)

重排序:从源码到最终执行示例图

  • 处理器在进行重排序时必须考虑到指令之间的数据依赖性
    在这里插入图片描述

JMM规范下多线程对变量的读写过程

由于JVM运行程序的实体是线程,而每个线程创建时JVM都会为其创建一个工作内存(有的地方称为栈空间),工作内存是每个线程的私有数据区域,而Java内存模型中规定所有变量都存储在主内存,主内存是共享内存区域,所有线程都可以访问,但线程对变量的操作(读写赋值等)必须在工作内存中进行,首先要将变量从主内存拷贝到线程自己的工作内存空间,然后对变量进行操作,操作完成后再将变量写回主内存,不能直接操作主内存中的变量,各个线程中的工作内存存储着主内存中的变量副本拷贝,因此不同的线程无法访问对方的工作内存,线程间的通信(传值)必须通过主内存来完成,其简要访问过程如下图:

在这里插入图片描述

JMM定义了线程和主内存之间的抽象关系

  • 线程之间的共享变量存储在主内存中(从硬件角度讲就是内存条)
  • 每个线程都有一个自己的本地工作内存,本地工作内存中存储了该线程用来读写共享变量的副本(从硬件角度来说就是CPU的缓存)

总结

  • 我们定义的所有共享变量都储存在物理主内存中
  • 每个线程都有自己独立的工作内存,里面保存该线程使用到的共享变量的副本(主内存中该变量的一份拷贝)
  • 线程对共享变量所有的操作都必须先在线程自己的工作内存中进行后写回主内存,不能直接从主内存在读写(不能越级)
  • 不同线程之间也无法直接访问其他线程的工作内存中的变量,线程间变量值的传递需要通过主内存来进行(同级不能互相访问)

JMM规范下多线程先行发生原则happens-before

  • 先行发生原则:多线程之间要配合,决定谁先谁后之后,互相让其他线程获得感知
  • 在JMM中,如果一个操作执行的结果需要对另一个操作可见或者代码重排序,那么这两个操作之间必须满足happens-before(先行发生)原则,逻辑上的先后关系。

x,y案例说明-写后读

在这里插入图片描述

问题:y是否100%等于5呢?

答案:不一定

  • 如果线程A的操作(x=5)happens-before(先行发生)线程B的操作(y=x),那么可以确定线程B执行y=5一定成立
  • 如果不存在happens-before原则,那么y=5不一定成立

先行并发原则说明

  • 如果Java内存模型中所有的有序性都需要靠volatile和synchronized来完成,那么有很多操作都将变得非常麻烦,但是我们在编写Java并发代码的时候并不需要处处用volatile和synchronized,这是因为Java语言的JMM原则下,有一个“先行发生”(happens-before)的原则限制和规矩,帮我们理好了规矩!
  • 这个原则非常重要:它是判断数据是否存在竞争,线程是否安全的有效手段。依赖这个原则,我们可以通过几条简单规则解决并发环境下两个操作之间是否可能存在冲突的所有问题,而不需要陷入Java内存模型晦涩难懂的底层编译原理之中。

happens-before总原则(面试回答话术)

  • 如果一个操作happens-before另一个操作,那么第一个操作的执行结果将对第二个操作可见,而且第一个操作的执行顺序排在第二个操作之前
  • 如果两个操作之间存在happens-before关系,并不意味着一定要按照happens-before原则制定的顺序来执行。如果重排之后的执行结果与按照happens-before关系来执行的结果一致,那么这种重排序并不非法(如1+2+3=3+2+1)

happens-before八大原则

从JDK 5开始,Java使用新的JSR-133内存模型,提供了 happens-before 原则来辅助保证程序执行的原子性、可见性以及有序性的问题,它是判断数据是否存在竞争、线程是否安全的依据,happens-before 原则内容如下:

次序规则一个线程内,按照代码的顺序,写在前面的操作先行发生于写在后面的操作,也就是说前一个操作的结果可以被后续的操作获取(保证语义串行性,按照代码顺序执行)。比如前一个操作把变量x赋值为1,那后面一个操作肯定能知道x已经变成了1

锁定规则:一个unLock操作先行发生于后面对同一个锁的lock操作(后面指时间上的先后)(A获得锁,释放后,B才能获得锁)

volatile变量规则:对一个volatile变量的写操作先行发生于后面对这个变量的读操作,前面的写对后面的读是可见的,这里的后面同样指时间上的先后

传递规则:如果操作A先行发生于操作B,而操作B又先行发生于操作C,则可以得出操作A先行发生于操作C

线程启动规则(Thread start Rule):Thread对象的start()方法先行发生于此线程的每一个动作

在这里插入图片描述

线程中断规则(Thread Interruption Rule):

  • 对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生(可以通过Thread.interrupted()检测到是否发生中断)
  • 通俗来说,就是要先调用interrupt()方法设置过中断标志位,才能检测到中断发生

线程终止规则(Thread Termination Rule):线程中的所有操作都优先发生于对此线程的终止检测,我们可以通过isAlive()等手段检测线程是否已经终止执行。

AI 解释

线程终止规则是JMM中的一条重要规则,它确保了一个线程在其终止之前的所有操作对其他线程是可见的。

  • 具体来说,当一个线程T即将结束时,JMM保证在T中执行的所有操作都会在T的终止状态变为“已终止”之前完成。这意味着如果线程T修改了共享变量,并且这些修改在T中可见,那么当T结束时,这些修改也会对外部线程可见。这个规则确保了线程在退出前能够正确地更新其状态,使得其他线程能够通过调用isAlive()方法检查到T的终止状态,并且能够看到T对共享数据所做的最后更改。
  • 例如,假设线程T在终止前更新了一个共享变量sharedVar,并且另一个线程U随后检查sharedVar的值。根据线程终止规则,U应该能够看到T对sharedVar的最新修改,即使U在T完全终止后才去检查sharedVar的值。同样,如果U在某个时刻调用了T的isAlive()方法并得到了false的结果,那么U可以确信T已经完成了所有操作并且已经终止。
  • 这个规则对于多线程编程非常重要,因为它帮助程序员确保线程间的交互是可预测的,避免了因线程终止状态不确定而导致的潜在错误。然而,需要注意的是,这个规则并不能保证线程的即时可见性,即其他线程可能需要执行一些额外的操作(如读取共享变量)来触发缓存刷新,从而看到最新的状态。这是因为JMM还允许编译器和处理器为了优化性能而进行重排序,但这种重排序必须遵守一定的规则,以保持程序的语义一致性。

对象终结规则(Finalizer Rule):一个对象的初始化完成(构造函数执行结束)先行发生于它的finalize()方法(JVM中一个对象被回收之前要执行的方法,finalize的通常目的是在对象被不可撤销地丢弃之前执行清理操作)的开始,即对象没有完成初始化之前,是不能调用finalize()方法的

happens-before总结

  • 在Java语言里面,Happens-before的语义本质上是一种可见性(说白了就是谁前谁后)
  • A happens-before B,意味着A发生过的事情对B而言是可见的,无论A事件和B事件是否发生在同一线程里
  • JVM的设计分为两部分:
    • 一部分是面向我们程序员提供的,也就是happens-before规则,它通俗易懂的向我们程序员阐述了一个强内存模型,我们只要理解happens-before规则,就可以编写并发安全的程序了
    • 另一部分是针对JVM实现的,为了尽可能少的对编译器和处理器做约束从而提升性能,JMM在不影响程序执行结果的前提下对其不做要求,即允许优化重排序,我们只要关注前者就好了,也就是理解happens-before规则即可,其他繁杂的内容由JMM规范结合操作系统给我们搞定,我们只写好代码即可。

案例

private int value = 0;
public int getValue(){
    return value;
}
public int setValue(){
    return ++value;
}

问题描述:

假设存在线程A和B,线程A先(时间上的先后)调用了setValue()方法,然后线程B调用了同一个对象的getValue()方法,那么线程B收到的返回值是什么?

**答案:**不一定

分析happens-before规则(规则5,6,7,8可以忽略,和代码无关)

1、由于两个方法由不同线程调用,不满足一个线程的条件,不满足程序次序规则

2、两个方法都没有用锁,不满足锁定规则

3、变量没有使用volatile修饰,所以不满足volatile变量规则

4、传递规则肯定不满足综上:无法通过happens-before原则推导出线程A happens-before 线程B,虽然可以确定时间上线程A优于线程B,但就是无法确定线程B获得的结果是什么(无法确定A的执行耗时),所以这段代码不是线程安全的(注意:如果两个操作的执行次序无法从happens-before原则推导出来,那么就不能保证他们的有序性,虚拟机可以随意对他们进行重排序)

如何修复?

  • 把getter/setter方法都定义为synchronized方法:能解决问题,但是不好,重量锁,并发性能下降
private int value = 0;
public synchronized int getValue(){
    return value;
}
public synchronized int setValue(){
    return ++value;
}
  • 把Value定义为volatile变量,由于setter方法对value的修改不依赖value的原值,满足volatile关键字使用场景
/**
* 利用volatile保证读取操作的可见性
* 利用synchronized保证复合操作的原子性
* 结合使用锁和volatile变量来减少同步的开销
*/
private volatile int value = 0;
public int getValue(){
    return value;
}
public synchronized int setValue(){
    // 使用synchronized 保证复合操作原子性
    return ++value;
}

java中使用volatile修饰变量有什么用?

AI回答:

在Java中,volatile关键字用于声明一个变量的状态可能会被不同的线程异步地改变,因此它提供了以下三个关键特性:

可见性

  1. 当一个线程修改了由volatile修饰的变量的值,新值会立即写回到主内存(Main Memory)。任何其他线程读取这个变量时,都会从主内存中读取该变量的最新值,而不是从线程的工作内存(Work Memory)中读取可能过期的副本。这样就保证了线程间对这个变量的可见性。

禁止指令重排序

  1. Java编译器和处理器通常会对代码进行优化,这可能导致指令重排序。虽然这种重排序在单线程环境中通常是安全的,但它可能会破坏多线程环境中的代码逻辑。volatile变量禁止了与它相关的指令重排序,以维护正确的执行顺序,从而避免了某些类型的竞态条件。

不保证原子性

  1. 虽然volatile提供了可见性和禁止指令重排序的好处,但它并不保证复合操作的原子性。例如,volatile int i; i++;这样的操作在多线程环境下仍然是不安全的,因为i++涉及读取、修改和写回三个步骤,中间可能被其他线程干扰。要保证复合操作的原子性,通常需要使用synchronized块或java.util.concurrent包中的原子类(如AtomicInteger)。

使用volatile的关键在于它提供了一种轻量级的同步机制,相比于锁(synchronized),它不需要上下文切换或线程阻塞,因此在某些情况下可以提高性能。但是,它只适用于简单的读/写操作,对于更复杂的场景,可能需要更强大的同步工具。

例如,如果你有一个计数器,只需要对其进行递增或递减操作,并且希望在多线程环境下保持一致性,使用volatile修饰这个计数器变量可能是一个合适的选择。但是,如果计数器的操作涉及到复杂的逻辑或多个变量之间的依赖关系,那么使用锁或其他更高级的并发控制机制可能是必要的。

文章说明

该文章是本人学习 尚硅谷 的学习笔记,文章中大部分内容来源于 尚硅谷 的视频尚硅谷JUC并发编程(对标阿里P6-P7),也有部分内容来自于自己的思考,发布文章是想帮助其他学习的人更方便地整理自己的笔记或者直接通过文章学习相关知识,如有侵权请联系删除,最后对 尚硅谷 的优质课程表示感谢。

  • 16
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Hello Dam

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值