JMM&并发编程的三大问题

编程小菜吉

已于 2022-10-19 19:25:09 修改

阅读量214

点赞数 1

分类专栏： JAVA并发编程文章标签： java

于 2022-10-19 18:56:35 首次发布

本文链接：https://blog.csdn.net/EnjoyFight/article/details/127398697

版权

JAVA并发编程专栏收录该内容

6 篇文章 0 订阅

订阅专栏

并发编程之JMM&并发编程的三大问题

一、JMM模型
二、数据同步操作
- 1、数据同步的八大原子操作
- 2、同步规则分析
三、并发编程

一、JMM模型

1、JMM介绍

Java内存模型(Java Memory Mode，简称JMM)是一种抽象的概念，并不真实存在，它描述的是一组规则或规范，通过这组规范定义了程序中各个变量（包括实例字段，静态字段和构成数组对象的元素）的访问方式。

Java内存模型中规定将内存分为主内存和工作内存。所有变量都存储在主内存，主内存是共享内存区域，所有线程都可以访问，但线程对变量的操作(读取赋值等)必须在工作内存中进行，首先要将变量从主内存拷贝的自己的工作内存空间，然后对变量进行操作，操作完成后再将变量写回主内存，不能直接操作主内存中的变量，工作内存中存储着主内存中的变量副本拷贝，前面说过，工作内存是每个线程的私有数据区域，因此不同的线程间无法访问对方的工作内存，线程间的通信(传值)必须通过主内存来完成。

JVM运行程序的实体是线程，而每个线程创建时JVM都会为其创建一个工作内存(有些地方称为栈空间)，用于存储线程私有的数据。

线程，工作内存，主内存工作交互图（基于JMM规范）
在这里插入图片描述

2、JMM不同于JVM内存区域模型

JMM与JVM内存区域的划分是不同的概念层次，更恰当说JMM描述的是一组规则，通过这组规则控制程序中各个变量在共享数据区域和私有数据区域的访问方式，JMM是围绕原子性，有序性、可见性展开。JMM与Java内存区域唯一相似点，都存在共享数据区域和私有数据区域，在JMM中主内存属于共享数据区域，从某个程度上讲应该包括了堆和方法区，而工作内存属于数据线程私有数据区域，从某个程度上讲则应该包括程序计数器、虚拟机栈以及本地方法栈。

3、主内存和工作内存

（1）主内存：主要存储的是Java实例对象，所有线程创建的实例对象都存放在主内存中，不管该实例对象是成员变量还是方法中的本地变量(也称局部变量)，当然也包括了共享的类信息、常量、静态变量。由于是共享数据区域，多条线程对同一个变量进行访问可能会发生线程安全问题。
（2）工作内存：主要存储当前方法的所有本地变量信息(工作内存中存储着主内存中的变量副本拷贝)，每个线程只能访问自己的工作内存，即线程中的本地变量对其它线程是不可见的，就算是两个线程执行的是同一段代码，它们也会各自在自己的工作内存中创建属于当前线程的本地变量，当然也包括了字节码行号指示器、相关Native方法的信息。注意由于工作内存是每个线程的私有数据，线程间无法相互访问工作内存，因此存储在工作内存的数据不存在线程安全问题。

根据JVM虚拟机规范主内存与工作内存的数据存储类型以及操作方式：
（1）对于一个实例对象中的成员方法而言，如果方法中包含本地变量是基本数据类型(boolean,byte,short,char,int,long,float,double)，将直接存储在工作内存的帧栈结构中
（2）倘若本地变量是引用类型，那么该变量的引用会存储在工作内存的帧栈中，而对象实例将存储在主内存(共享数据区域，堆)中
（3）对于实例对象的成员变量，不管它是基本数据类型或者包装类型(Integer、Double等)还是引用类型，都会被存储到堆区
（4） static变量以及类本身相关信息将会存储在主内存中

注意：在主内存中的实例对象可以被多线程共享，倘若两个线程同时调用了同一个对象的同一个方法，那么两条线程会将要操作的数据拷贝一份到自己的工作内存中（这个时候此数据在两个线程中不可见），执行完成操作后才刷新到主内存。
在这里插入图片描述

4、JMM与硬件内存架构的关系

实际上，多线程的执行最终都会映射到硬件处理器上进行执行，但Java内存模型和硬件内存架构并不完全一致。
（1）硬件内存：分为寄存器、CPU缓存、主内存
（2）JMM：分为工作内存（线程私有数据区域）和主内存（堆内存）

JMM对内存的划分对硬件内存并没有任何影响，因为JMM只是一种抽象的概念，是一组规则，并不实际存在。不管是工作内存的数据还是主内存的数据，对于计算机硬件来说，在计算机主内存、CPU缓存或者寄存器中，都可能存在。

总体上来说，JMM和计算机硬件内存架构是一个相互交叉的关系，是一种抽象概念划分与真实物理硬件的交叉

在这里插入图片描述

5、JMM存在的必要性

由于JVM运行程序的实体是线程，而每个线程创建时JVM都会为其创建一个工作内存(有些地方称为栈空间)，用于存储线程私有的数据，线程与主内存中的变量操作必须通过工作内存间接完成，主要过程是将变量从主内存拷贝的每个线程各自的工作内存空间，然后对变量进行操作，操作完成后再将变量写回主内存，如果存在两个线程同时对一个主内存中的实例对象的变量进行操作就有可能诱发线程安全问题。

假设主内存中存在一个共享变量x，现在有A和B两条线程分别对该变量x=1进行操作，A/B线程各自的工作内存中存在共享变量副本x。假设现在A线程想要修改x的值为2，而B线程却想要读取x的值，那么B线程读取到的值是A线程更新后的值2还是更新前的值1呢？答案是，不确定
在这里插入图片描述

二、数据同步操作

1、数据同步的八大原子操作

（1）lock（锁定）：作用于主内存中，将主内存中的变量变成一个独占的状态，意思就是当线程A访问变量B的时候，其它的线程不能同时访问。
（2）unlock（解锁）：作用于主内存中，将一个处于锁定状态的变量释放出来，释放之后才能被其它线程所访问。
（3）read（读取）：将主内存中的一个变量复制一份放到总线中，以便于后续的load动作加载到工作内存中。
（4）load（载入）：作用于工作内存中，他将read操作从主内存中得到的变量值副本经过load操作放到线程私有的工作内存中。
（5）use（使用）：作用于工作内存，将load操作载入到工作内存的某一变量的值传递给执行引擎。
（6）assign（赋值）：将执行引擎的一个值赋给线程私有的工作内存的某一变量。
（7）store（存储）：将线程私有的工作内存中的值传递到主内存中，以便后续的write操作。
（8）write（写入）：将store操作的值赋值给主内存的变量，相当于一个同步的操作。
注意：Java内存模型只要求上述操作必须按顺序执行，而没有保证必须是连续执行。
在这里插入图片描述

2、同步规则分析

（1）不允许一个线程无原因地（没有发生过任何assign操作）把数据从工作内存同步回主内存中
（2）一个新的变量只能在主内存中诞生，不允许在工作内存中直接使用一个未被初始化（load或者assign）的变量。即就是对一个变量实施use和store操作之前，必须先自行assign和load操作。
（3）一个变量在同一时刻只允许一条线程对其进行lock操作，但lock操作可以被同一线程重复执行多次，多次执行lock后，只有执行相同次数的unlock操作，变量才会被解锁。lock和unlock必须成对出现
（4）如果对一个变量执行lock操作，将会清空工作内存中此变量的值，在执行引擎使用这个变量之前需要重新执行load或assign操作初始化变量的值。
（5）如果一个变量事先没有被lock操作锁定，则不允许对它执行unlock操作；也不允许去unlock一个被其他线程锁定的变量。
（6）对一个变量执行unlock操作之前，必须先把此变量同步到主内存中（执行store和write操作）。

三、并发编程

1、Java并发编程的三大问题

并发编程存在三大问题，JMM不会帮我们自动解决，但是也提供了一些解决方法给我们

（1）可见性：可见性是当一个变量被其中一个线程修改了，其它使用该变量的线程都会看到这个线程被修改了，将会重新从主内存中去load这个变量。

（2）原子性：原子性指的是一个操作是不可中断的，即使是在多线程环境下，一个操作一旦开始就不会被其他线程所中断影响。

（3）有序性：对于单线程来说，程序的执行是有序性的，也就是说程序的执行是按照我们所写的顺序执行的，但是在多线程中就不一定了，因为程序编译时会出现一种叫做指令重排的过程，指令重排之后就不一定是我们写的代码顺序了，但是指令重排的同时必须要保证执行的结果与原始的结果一致。在Java程序中，倘若在本线程内，所有操作都视为有序行为，如果是多线程环境下，一个线程中观察另外一个线程，所有操作都是无序的，前半句指的是单线程内保证串行语义执行的一致性，后半句则指指令重排现象和工作内存与主内存同步延迟现象。

2、Java并发编程的三大问题解决

（1）可见性问题：
①volatile关键字保证可见性。当一个共享变量被volatile修饰时，它会保证修改的值立即被其他的线程看到，即修改的值立即更新到主存中，当其他线程需要读取时，它会去内存中读取新值。
②synchronized和Lock也可以保证可见性，因为它们可以保证任一时刻只有一个线程能访问共享资源，并在其释放锁之前将修改的变量刷新到内存中。
（2）原子性问题：除了JVM本身为我们提供的基本类型操作是原子类型外，可以通过synchronized和Lock实现原子性，因为synchronized和Lock可以保证同一时间内只能有一个线程访问此代码块。
（3）有序性问题：在Java里面，可以通过volatile关键字来保证一定的“有序性”。另外可以通过synchronized和Lock来保证有序性，很显然，synchronized和Lock保证每个时刻是有一个线程执行同步代码，相当于是让线程顺序执行同步代码，自然就保证了有序性。

3、跟有序性相关的几个知识点

3.1、指令重排序

java语言规范规定JVM线程内部维持顺序化语义。即只要程序的最终结果与它顺序化情况的结果相等，那么指令的执行顺序可以与代码顺序不一致，此过程叫指令的重排序。

JVM能根据处理器特性（CPU多级缓存系统、多核处理器等）适当的对机器指令进行重排序，使机器指令能更符合CPU的执行特性，最大限度的发挥机器性能。

3.2、as-if-serial语义

含义：无论如何重排序，程序的最终执行结果是不能变的。
所以，在这个语义下，编译器为了保持这个语义，不会去对存在有数据依赖关系的操作进行重排序，如果数据之间不存在依赖关系，这些操作就会被操作系统进行最大的优化，进行重排序，使得代码的执行效率更高

3.3、happens-before 原则

Java并发编程必须要保证代码的原子性，有序性，可见性，如果只靠sychronized和volatile关键字来保证它，那么我们的代码写起来就显的相当的麻烦，从JDK 5开始，Java使用新的JSR-133内存模型，提供了happens-before 原则来辅助保证程序执行的原子性、可见性以及有序性的问题，它是判断数据是否存在竞争、线程是否安全的依据。

八大子原则：
（1）程序顺序原则：即在一个线程内必须保证语义串行性，也就是说按照代码顺序执行。
（2）锁规则：解锁(unlock)操作必然发生在后续的同一个锁的加锁(lock)之前，也就是说，如果对于一个锁解锁后，再加锁，那么加锁的动作必须在解锁动作之后(同一个锁)。
（3）volatile规则： volatile变量的写，先发生于读，这保证了volatile变量的可见性，简单的理解就是，volatile变量在每次被线程访问时，都强迫从主内存中读该变量的值，而当该变量发生变化时，又会强迫将最新的值刷新到主内存，任何时刻，不同的线程总是能够看到该变量的最新值。
（4）线程启动规则：线程的start()方法先于它的每一个动作，即如果线程A在执行线程B的start方法之前修改了共享变量的值，那么当线程B执行start方法时，线程A对共享变量的修改对线程B可见。
（5）线程终止规则：线程的所有操作先于线程的终结，Thread.join()方法的作用是等待当前执行的线程终止。假设在线程B终止之前，修改了共享变量，线程A从线程B的join方法成功返回后，线程B对共享变量的修改将对线程A可见。
（6）线程中断规则：对线程 interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生，可以通过Thread.interrupted()方法检测线程是否中断。
（7）传递性 ：A先于B ，B先于C 那么A必然先于C。
（8）终结原则：对象终结规则对象的构造函数执行，结束先于finalize()方法。