Java内存模型

计算机内存模型

计算机在执行程序时,每条指令都是在CPU中执行的,而指令执行的过程中,势必涉及到数据的读取和写入。由于程序运行过程中的临时数据是存放在主存(物理内存)当中的,这时就存在一个问题:

  • 由于CPU执行速度很快,而从内存读取数据和向内存写入数据的过程跟CPU执行指令的速度比起来要慢很多,因此如果任何时候对数据的操作都要通过和内存的交互来进行,那么就会大大降低指令执行的速度
    因此在CPU里面就有了高速缓存:
  • 当程序在运行过程中,会将运算所需要的数据从主存复制一份到CPU的高速缓存中,那么CPU进行计算的时候就可以直接从它的高速缓存中读取数据和向其中写入数据,当运算结束之后,再将高速缓存中的数据刷新到主存中去

例子

举个例子,以如下这段代码为例:

i = i + 1

当线程执行这个语句时,会先从主存当中去读取i的值,然后复制一份到高速缓存当中,然后CPU执行指令对i进行加1操作,然后将数据写入到高速缓存,最后将高速缓存中i的最新值刷新到主存中去

存在的问题:缓存一致性问题

这个代码在单线程中运行是没有任何问题的,但是在多线程中运行就会有问题了。在多核CPU中,每条线程可能运行于不同的CPU中,因此每个线程运行时会有自己的高速缓存。比如:同时有两个线程执行这段代码,假设i的初始值为0,那么我们希望两个线程执行完之后i的值变为2,但是事实是这样吗?
可能会出现的情况:

  • 初始时,两个线程分别读取i的值存入各自所在的CPU的高速缓存当中
  • 线程1进行加1操作,然后把i的最新值1写入到内存
  • 此时线程2的高速缓存当中的i值还是0,进行加1操作之后,i的值为1,然后线程2把i的值写入到内存
  • 最终结果i的值是1,而不是2,这就是缓存一致性问题
解决方案

通常称这种被多个线程访问的变量为共享变量,为了解决缓存不一致性的问题,通常来说有以下2种解决方法:

  • 通过在总线加Lock(锁)的方式
  • 通过缓存一致性协议

这两种方式都是硬件层面上提供的解决方式
在早期的CPU当中,是通过在总线上加Lock(锁)的形式来解决缓存不一致性的问题。因为CPU和其它部件进行通信都是通过总线来进行的,如果对总线加Lock(锁)的话,也就是阻塞了其它CPU对其它部件的访问,如:内存,从而使得只能有一个CPU能使用这个变量的内存。比如上面的例子中,如果一个线程在执行i=i+1,如果在执行这段代码的过程中,在总线上发出了Lock(锁)的信号,那么只有等待这段代码完全执行完毕之后,其它CPU才能从变量i所在的内存中读取变量,然后进行相应的操作。这样,就解决了缓存不一致性的问题,但是这种方式会存在一个问题:由于锁住总线期间,其它CPU无法访问内存,导致效率低下

因此出现了缓存一致性协议:
最出名的就是Intel的MESI协议,MESI协议保证了每个缓存中使用的共享变量的副本是一致的。它的核心思想是:当CPU写数据时,如果发现操作的变量是共享变量,即在其他CPU中也存在该变量的副本,会发出信号通知其他CPU将该变量的缓存行置为无效状态,因此当其他CPU需要读取这个变量时,发现自己缓存中缓存该变量的缓存行是无效的,那么它就会从内存重新读取
在这里插入图片描述

Java内存模型

描述多线程环境中线程与内存的关系
在Java虚拟机规范中试图定义一种Java内存模型(Java Memory Model,JMM)来屏蔽各个硬件平台和操作系统的内存访问差异,以实现让Java程序在各种平台下都能达到一致的内存访问效果。那么Java内存模型规定了程序中变量的访问规则,往大一点说是定义了程序执行的次序
注意: 为了获得较好的执行性能,Java内存模型并没有限制执行引擎使用处理器的寄存器或者高速缓存来提升指令执行速度,也没有限制编译器对指令进行重排序;也就是说,在java内存模型中,也会存在缓存一致性问题和指令重排序的问题

Java内存模型规定

  • 所有的变量都是存在主存当中(类似于前面说的物理内存)
  • 每个线程都有自己的工作内存(类似于前面的高速缓存)
  • 线程对变量的所有操作都必须在工作内存中进行,而不能直接对主存进行操作
  • 并且每个线程不能访问其他线程的工作内存
  • 上述提到的主内存可以简单认为是堆内存,而工作内存则可以认为是栈内存

原子性、可见性、有序性

在Java中,执行下面这个语句:

i = 10;

执行线程必须先在自己的工作线程中对变量i所在的缓存行进行赋值操作,然后再写入主存当中;而不是直接将数值10写入主存当中;那么Java语言本身对 原子性、可见性以及有序性提供了哪些保证呢?

原子性

即一个操作或者多个操作 要么全部执行并且执行的过程不会被任何因素打断,要么就都不执行
在Java中,对基本数据类型的变量的读取和赋值操作是原子性操作,即这些操作是不可被中断的,要么执行,要么不执行。上面一句话虽然看起来简单,但是理解起来并不是那么容易。请分析以下哪些操作是原子性操作:

x = 10;         //语句1
y = x;          //语句2
x++;            //语句3
x = x + 1;      //语句4

可能很多都会说上面的4个语句中的操作都是原子性操作;其实只有语句1是原子性操作,其他三个语句都不是原子性操作:

  • 语句1是直接将数值10赋值给x,也就是说线程执行这个语句的会直接将数值10写入到工作内存中
  • 语句2实际上包含2个操作,它先要去读取x的值,再将x的值写入工作内存,虽然读取x的值以及将x的值写入工作内存 这2个操作都是原子性操作,但是合起来就不是原子性操作了
  • 同样的,x++ 和 x=x+1包括3个操作:读取x的值,进行加1操作,写入新的值
    也就是说,只有简单的读取、赋值(而且必须是将数字赋值给某个变量,变量之间的相互赋值不是原子操作)才是原子操作

不过这里有一点需要注意:在32位平台下,对64位数据的读取和赋值是需要通过两个操作来完成的,不能保证其原子性。但是好像在最新的JDK中,JVM已经保证对64位数据的读取和赋值也是原子性操作了
从上面可以看出,Java内存模型只保证了基本读取和赋值是原子性操作,如果要实现更大范围操作的原子性,可以通过synchronized和Lock来实现。由于synchronized和Lock能够保证任一时刻只有一个线程执行该代码块,那么自然就不存在原子性问题了,从而保证了原子性

可见性

可见性是指当多个线程访问同一个变量时,一个线程修改了这个变量的值,其他线程能够立即看得到修改的值
对于可见性,Java提供了volatile关键字来保证可见性:

  • 当一个共享变量被volatile修饰时,它会保证修改的值会立即被更新到主存,当有其他线程需要读取时,它会去内存中读取新值
  • 而普通的共享变量不能保证可见性,因为普通共享变量被修改之后,什么时候被写入主存是不确定的,当其他线程去读取时,此时内存中可能还是原来的旧值,因此无法保证可见性
    另外,通过synchronized和Lock也能够保证可见性,synchronized和Lock能保证同一时刻只有一个线程获取锁然后执行同步代码,并且在释放锁之前会将对变量的修改刷新到主存当中,因此可以保证可见性
有序性

即程序执行的顺序按照代码的先后顺序执行

指令重排
  • 一般来说,处理器为了提高程序运行效率,可能会对输入代码进行优化,它不保证程序中各个语句的执行先后顺序同代码中的顺序一致,但是它会保证程序最终执行结果和代码顺序执行的结果是一致的
  • 处理器在进行重排序时是会考虑指令之间的数据依赖性,如果一个指令Instruction 2必须用到Instruction 1的结果,那么处理器会保证Instruction 1会在Instruction 2之前执行
  • 在Java内存模型中,允许编译器和处理器对指令进行重排序:
    • 但是重排序过程不会影响到单线程程序的执行(数据依赖性,指令重排会考虑到)
    • 却会影响到多线程并发执行的正确性
happens-before原则

在Java里面,保证有序性的方式有2种:

  • 可以通过volatile关键字来保证一定的“有序性”(具体原理在下一节讲述)
  • 另外可以通过synchronized和Lock来保证有序性
    很显然,synchronized和Lock保证每个时刻是有一个线程执行同步代码,相当于是让线程顺序执行同步代码,每次只有一个线程在执行代码(单线程),自然就保证了有序性

另外,Java内存模型具备一些先天的“有序性”:

  • 即不需要通过任何手段就能够得到保证的有序性,这个通常也称为 happens-before 原则
  • 如果两个操作的执行次序无法从happens-before原则推导出来,那么它们就不能保证它们的有序性,虚拟机可以随意地对它们进行重排序

下面就来具体介绍下happens-before原则(先行发生原则):

  1. 程序次序规则
    一个线程内,按照代码顺序,书写在前面的操作先行发生于书写在后面的操作
  2. 锁定规则(重要)
    一个unLock操作先行发生于后面对同一个锁的lock操作
    无论在单线程中还是多线程中,同一个锁如果出于被锁定的状态,那么必须先对锁进行了释放操作,后面才能继续进行lock操作
  3. volatile变量规则(重要)
    对一个变量的写操作先行发生于后面对这个变量的读操作
    如果一个线程先去写一个变量,然后一个线程去进行读取,那么写入操作肯定会先行发生于读操作
  4. 传递规则
    如果操作A先行发生于操作B,而操作B又先行发生于操作C,则可以得出操作A先行发生于操作C
  5. 线程启动规则
    Thread对象的start()方法先行发生于此线程的每个一个动作
  6. 线程中断规则
    中断线程的代码检测到中断事件的发生后,进行线程interrupt()方法的调用
  7. 线程终结规则
    线程中所有的操作都先行发生于线程的终止检测
    我们可以通过Thread.join()方法结束、Thread.isAlive()的返回值检测到线程已经终止执行
  8. 对象终结规则
    一个对象的初始化完成先行发生于他的finalize()方法的开始
    Java当中的finalize是用来清理一些东西的
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值