深入理解Java虚拟机(七)Java内存模型与线程

Mrkang1314

已于 2023-10-09 10:53:55 修改

阅读量239

点赞数

分类专栏： JVM Java语言 Java并发编程文章标签： java 开发语言

于 2019-03-22 19:09:42 首次发布

本文链接：https://blog.csdn.net/mashaokang1314/article/details/88711436

版权

Java语言同时被 3 个专栏收录

141 篇文章 14 订阅

订阅专栏

JVM

14 篇文章 0 订阅

订阅专栏

Java并发编程

13 篇文章 0 订阅

订阅专栏

前言
在多处理系统中，每个处理器都有自己的高速缓存，而他们又共享统一主存。为了使处理器内部的运算单元能够尽量被充分利用，处理器可能会对输入的代码进行乱序优化，称为指令重排顺序优化

Java内存模型JMM

主要目标：规范内存数据与工作空间数据的交互；屏蔽掉各种硬件和操作系统的内存访问差异，以实现让java程序在各种平台下都能达到一致的并发效果。

主存与工作内存

主存
所有变量(共享的)都存储在主内存，这里的变量是指实例字段、静态字段和构成数组对象的元素，不同于Java编程时所说的变量(线程私有的)，如局部变量、方法参数。

工作内存
每条线程都有自己的工作内存，保存了该线程使用到的变量的主内存副本拷贝，**线程对变量的所有操作都必须在工作内存中进行，**而不能直接读写主内存的变量，不同线程之间也无法访问对方的工作内存。

在这里插入图片描述 JMM与Java内存区域划分的区别和联系

区别：两者是不同的概念层次，JMM是抽象的，它是用来描述一组规则，通过这个规则来控制各变量的访问方式，围绕原子性、有序性、可见性等展开的，而Java运行时的划分是具体的，是JVM运行Java程序时，必要的内存划分。
联系：都存在私有数据区域和共享数据区域，一般来说，JMM中的主内存属于共享区域，包含堆、方法区；同样，JMM中的本地内存术语私有数据区域，包含程序计数器、本地方发栈、虚拟机栈。

硬件内存架构与java内存模型

硬件架构

在这里插入图片描述

CPU缓存一致性问题：一个cpu修改数据，另一个CPU读取数据，发生脏读，并发处理不同步；
解决方案：
- 总线加锁：只能有一个CPU对数据进行访问，会降低CPU吞吐量；
- 缓存上的一致性协议(MESI)：当CPU在Cache中操作数据时，如果该数据是共享变量，数据在Cache读到寄存器中，进行新的修改，并更新内存数据。Cache Line置为无效，其他的CPU就直接从内存中读数据，而不是从缓存中。

Java线程与硬件处理器

在这里插入图片描述

Java内存模型与硬件内存架构的关系

在这里插入图片描述

内存间交互操作

操作名称	描述
lock(锁定)	作用于主内存的变量，把一个变量表示为一条线程独占的状态
unlock(解锁)	作用于主内存的变量，它把一个处于锁定状态的变量释放出来，释放后的变量才可以被其他线程锁定
read(读取)	作用于主内存的变量，它把一个变量的值从主内存传输到线程的工作内存中，一般随后的load动作使用
load(载入)	作用于工作内存的变量，把read操作从主存中得到的变量值放入工作内存的变量副本中
user(使用)	作用于工作内存的变量，把工作内存中的一个变量的值传递给执行引擎，每当虚拟机遇到一个需要使用到变量的值的字节码指令时将会执行这个操作
assign(赋值)	作用于工作内存的变量，把一个从执行引擎中接受到的值赋值给工作变量
store(存储)	作用于工作内存的变量.把工作内存中的一个变量的值传送到主内存中
write(写入)	作用于主内存的变量，把store操作从工作内存中得到的变量的值放入主内存的变量中

Java内存模型操作的规则：

不允许read和load、store和write操作之一单独出现。保证了工作内存和主存之间传输数据的原子性；
不允许一个线程丢弃它的最近的assign操作，即变量在工作内存中改变之后必须同步到主存中；
不允许一个线程无原因的把数据从工作内存同步到主存中，即工作内存中的变量没有发生assign操作；
一个新的变量只能从主存中诞生，不允许在工作内存中直接使用一个未被初始化的标变量；
一个变量在同一时刻只允许一条线程对其进行lock操作，但可以被同一线程lock多次，之后以相同次数的unlock解锁；
如果对一个变量执行lock操作，将会清空工作内存中此变量的值，在执行引擎使用这个变量之前，需要重新执行load或assign操作初始化变量。
如果变量事先没有被lock锁定，则不允许对他执行unlock操作；
一个变量进行unlock之前，必须先把变量同步会主存中。

对于volatile型变量的特殊规则
假定T表示一个线程，V和W分别表示两个volatile型变量，那么在进行上述的操作的时候需要满足以下规则：

线程T对变量V的use动作可以认为是与线程T对变量V的load和read动作相关联的，必须一起连续出现，保证了每次使用V前都必须先从主内存刷新的最新值，用于保证能看见其他线程对变量V所做的修改后的值；
线程T对变量V的assign动作可以认为是与线程T对V的store和write动作相关联的，必须连续出现，保证了每次修改V后都必须立刻同步回主存中，用于保证其他线程可以看到自己对变量V所做的修改。
对这两个变量如果对V执行或赋值在对W执行之前，那么写入主存时V也在W之前；保证了变量不会被指令重排优化。

总结
所以volatile型变量不是线程安全的，不能保证从主存拿出，执行完再放回去这一系列操作的原子性，有可能一个线程A从主存拿到了变量read、load、use这一系列操作是原子性，执行完后assign、store、write这一系列操作是原子性，但是执行的过程中如果再有别的线程B又经过这个系列操作，则拿到的还是A未修改前的变量。

使用volatile的意义

-大多数情况下volatile的总开销比锁来的低；

使用volatile的场景

运算结果并不依赖变量的当前值，或者能够确保只有单一的线程修改变量的值；
变量不需要与其他的状态变量共同参与不变约束。

对long和double型变量的规则

允许虚拟机将没有被volatile修饰的64为数据的读写操作划分两次32位的操作来执行。

原子性、可见性和有序性

原子性
原子性是指一个操作是不可中断的，即使是在多个线程一起执行的时候，一个操作一旦开始就不会被其他线程干扰。
大概可以认为基本数据类型的访问读写是具备杯原子性的；尽管虚拟机把lock和unlock开放给用户，但是确提供了更高层次的字节码指令monitorenter和monitorexit来隐式使用这两个操作，反映到Java代码中就是同步块synchronized关键字。

可见性
是指当一个线程修改了某一个变量的值，其他线程是否能立即知道这个修改。
除了volatile之外，Java中的synchronized和final也能实现可见性；

同步块的可见性是由"在执行unlock之前，必须把此变量同步到主内存中"这条规则获得的；
final的可见性是指：被final修饰的字段在构造器中一旦初始化完成，并且构造器没有吧this的引用传递出去，那么其他线程中就能看见final字段的值。

有序性
一句话总结为"如果在本线程内观察，所有的操作都是有序的；如果在一个线程观察另一个线程，所有的操作都是无序的"。
volatile和synchronized都可以保证有序性

volatile本身就包含了进制指令重排序的语义；
synchronized则是由"一个变量在同一时刻只允许一条线程对其进行lock操作"这条规则获得的，确定了只能串行进入。

重排序

什么是重排序？

计算机在执行程序时，为了提高性能，编译器和处理器常常会对指令做重排；

为什么指令重排序可以提高性能？

简单地说，每一条指令都会包含多个步骤，每个步骤可能使用不同硬件，因此，流水线技术产生了，它的原理是指令1还没有执行完，口开始执行指令2，而不用等到指令1执行结束之后再执行指令2，这样就大大提盖效率。但是流水线技术最害怕中断，恢复中断的代价是比较大的，所以要想办法不让流水线中断，执行重排就是减少中断的一种技术。

指令重排对于提高CPU处理性能十分必要，虽然由此代来乱序问题，但是牺牲是值得的；

指令重排一般分为三种：

编译器优化重排：编译器在不改变单线程程序语义的前提下，可以重新安排语句的执行顺序；
指令并行重排：现代处理器采用了指令级并行技术将多条指令重叠执行，如果不存在数据依赖性，处理器可以改变语句对应的机器指令的执行顺序；
内存系统重排：由于处理器使用缓存和读写缓冲区，这使得加载和存储操作看上去可能实在乱序执行，因为三级缓存的存在，导致内存与缓存的数据同步存在时间差。

指令重排可以保证串行语义一直，但是没有义务保证多线程间语义也一致，所以在多线程下，指令重排序可能会导致一些问题。

一条指令的执行是可以分为很多步骤的
大概分为：

取指 IF；
译码和取寄存器操作数ID；
执行或者有效地址计算EX；
存储器访问MEM；
写回WB；

在这里插入图片描述
指令的执行分为多个步骤，而实际上当指令1执行完IF后，IF操作所使用的寄存器或其他资源就会空闲出来；这时候指令2就可以使用。所以有可能指令1还没执行完，指令5就开始执行了。相当于流水线处理，每个时钟下寄存器都可以执行指令的步骤。

上图中的“*”代表不做操作，因为一个硬件资源同一时刻不能处理两个指令。但是这样降低了CPU的性能。

所以可以使两个没有依赖性的指令步骤进行顺序交换；
在这里插入图片描述
调整之后，*消失，这就是指令重排序优化。

顺序一致性模型

顺序一致性内存模式是一个理论化的理论参考模型,它为程序员提供了极强的内存可见性保证。

顺序一致性模型有两大特征：

一个线程中的所有操作必须按照程序的顺序来执行；
不管程序是否同步，所有线程都只能看到一个单一的操作执行顺序，即在顺序一致性模型中，每一个操作必须是原子性的，且立刻对所有线程可见。

JMM中同步程序的顺序一致性效果

在顺序一致性模型中，所有操作完全按照程序的顺序串行执行，但是在JMM中，临界区内（同步代码）的代码可以发生重排序。但是在临界区的重排序并不影响其他线程，既提高了效率有没有改变程序执行结果。**JMM的具体实现方针是：在不改变（正确同步的）**程序执行结果的前提下，尽量为编译器和处理器的优化打开方便之门。

JMM中未同步程序的顺序一致性效果

JMM没有保证未同步程序的执行结果与该程序在顺序一致性中执行结果一致，因为如果要保证执行结果一致，那么JMM需要禁止大量的优化，对程序的执行性能会产生很大的影响。

未同步的程序在JMM和顺序一致性内存模型中的差异

顺序一致性保证单线程内的操作会按程序的顺序执行，JMM不保证单线程内的操作会按程序的顺序执行。
顺序一致性模型保证所有线程只看到一致的操作执行顺序，而JMM不保证所有线程能看到一致的操作执行顺序；
JMM不保证对64位的long和double变量的写操作具有原子性，而顺序一致性模型保证对所有的内存读写操作都具有原子性。

先行发生原则happens-before

一方面，程序员需要JMM提供一个强的内存模型来编写代码，另一方面，编译器和处理器希望JMM对它们的束缚越少越好，这样它们就可以最可能多的做优化来提高性能，希望的是一个弱的内存模型。
JMM考虑到了这两种需求，并且找到了平衡点，对编译器和处理器来说，只要不改变程序的执行结果（单线程和正确同步了的多线程程序），编译器和处理器怎么优化都行。

概念：先行发生：如果操作A先行发生于操作B，其实就是说发生操作B之前，操作A产生的影响能被操作B观察到。
Java语言无需任何同步手段保障能成立的先行发生规则

程序次序规则
在一个线程内，按照程序代码顺序，书写在前面的操作先行发生于书写在后面的操作。

管程锁定规则
一个unlock操作先行发生于后面对同一个锁的lock操作；

volatile变量规则
对一个volatile变量的写操作先行发生于后面对这个变量的读操作。

线程启动规则
Thread对象的start方法先行于发生此线程的每一个动作；

线程终止规则
线程的所有操作都先行于此线程的终止检测；

线程中断规则
对线程interrupt方法的调用先行发生于被中断线程的代码检测到中断事件的发生。

传递性
如果A先行发生于B，B先行发生于操作C，则可以得出操作A先行发生于操作C的结论。

个人理解happens-before

线程A happens-before 线程B 不等于线程A在线程B之前执行，而是线程B知道线程A执行了。
如果线程A执行了，但是执行结果没有写入主内存，此时线程B并不知道线程A执行结果，然后线程B执行，这种不能叫做线程A hadppens-before线程B。

Volatile规则是如何实现的

总结
如果一个操作时间上的先发生，如果不满足上述的先行发生规则，或不能由上述规则推出。则不代表这个操作会是先行发生，同样如果先行发生，也不能代表时间上的先发生。所以在衡量并发安全问题时一切以先行发生为准。

Java与线程

实现线程的三种方式

使用内核线程实现
内核线程就是直接由操作系统内核支持的线程，这种线程由内核来完成线程切换，内核通过操纵调度器对线程进行调度，并负责将线程的任务映射到各个处理器上。
使用用户线程实现
完全建立在用户空间的线程库，系统内核不能感知到线程存在的实现，用户线程的建立、同步、销毁和调度完全在用户态中完成，不需要内核的帮助。
混合实现
轻量级进程作为用户线程和内核线程之间的桥梁，这样可以使用内核线程调度功能及处理器映射。

Mrkang1314

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深入理解Java虚拟机(七)Java内存模型与线程

前言在多处理系统中，每个处理器都有自己的高速缓存，而他们又共享统一主存。为了使处理器内部的运算单元能够尽量被充分利用，处理器可能会对输入的代码进行乱序优化，称为指令重排顺序优化Java内存模型JMM主要目标：定义程序中各个变量的访问规则，主存与工作内存主存所有变量(共享的)都存储在主内存，这里的变量是指实例字段、静态字段和构成数组对象的元素，不同于Java编程时所说的变量(线程私有的...
复制链接

扫一扫

专栏目录