JAVA内存模型与JVM内存结构

最新推荐文章于 2024-08-12 09:37:50 发布

EQuaker

最新推荐文章于 2024-08-12 09:37:50 发布

阅读量228

点赞数 1

分类专栏：锁文章标签： jvm java

本文链接：https://blog.csdn.net/EQuaker/article/details/110932804

版权

锁专栏收录该内容

5 篇文章 1 订阅

订阅专栏

写在前面：

JVM内存结构、Java内存模型和Java对象模型是截然不同的三种概念。

JVM内存结构：和Java虚拟机的运行时区域有关。
Java内存模型：和Java的并发编程有关。
Java对象模型：和Java对象在虚拟机中的表现形式有关。

Java 内存模型，描述的是多线程允许的行为
JVM 内存结构，描述的是线程运行所设计的内存空间

JVM 是什么呢？它屏蔽了底层架构的差异性，是 Java 跨平台的依据，也是每个 Java 程序员必须了解的一部分。

在了解这三个对象之前，我们先来看看一个更大的概念 JVM体系结构

一，JVM体系结构

Java Virtual Machine(JVM) 是一种抽象的计算机，基于堆栈架构，它有自己的指令集和内存管理。它加载 class 文件，分析、解释并执行字节码。基本结构如下：

JVM Architecture

如上图所示，JVM 主要分为三个子系统：类加载器、运行时数据区和执行引擎。

1.1，类加载器子系统

它主要功能是处理类的动态加载，还有链接，并且在第一次引用类时进行初始化。

1.1.1，Loading - 加载，顾名思义，用于加载类，它有三种类加载器，根据双亲委托模型，从不同路径进行加载：

Bootstrap ClassLoader - 加载 rt.jar 核心类库，是优先级最高的加载器
Extension ClassLoader - 负责加载 jre\lib\ext 文件夹中的类
Application ClassLoader -负责加载 CLASSPATH 指定的类库

1.1.2，Linking - 链接，动态链接到运行时所需的资源，分为三步：

Verify - 验证：验证生成的字节码是否正确
Prepare - 准备：为所有静态变量，分配内存并赋予默认值
Resolve - 解析：将 class 文件常量池中所有对内存的符号引用，替换成到方法区的直接引用

1.1.3，Initialization - 类初始化，类加载的最后阶段，这里对静态变量进行赋值，并执行静态块。（注意区分对象初始化）

1.2，运行时数据区

它约定了在运行时程序代码的数据比如变量、参数等等的存储位置，主要包含以下几部分：

PC 寄存器（程序计数器）：保存正在执行的字节码指令的地址
栈：在方法调用时，创建一个叫栈帧的数据结构，用于存储局部变量和部分过程的结果，栈帧由以下几部分组成：
- 局部变量表：存储方法调用时传递的参数，从0开始存储this、方法参数、局部变量
- 操作数栈：执行中间操作，存储从局部变量表或对象实例字段复制的常量或变量值，以及操作结果，另外，还用来准备被调用方法的参数和接受方法调用的返回结果
- 动态链接：一个指向运行时常量池的引用，将 class 文件中的符号引用（描述一个方法调用了其他方法或访问成员变量）转为直接引用
- 方法返回地址：方法正常退出或抛出异常退出，返回方法被调用的位置
堆：存储类实例对象和数组对象，垃圾回收的主要区域
方法区：也被称为元空间，还有个别名 non-heap（非堆），使用本地内存存储 class meta-data 元数据（运行时常量池，字段和方法的数据，构造函数和方法的字节码等），在 JDK 8 中，把 interned String 和类静态变量移动到了 Java 堆。用于存储已经被虚拟机加载的类信息，常量，静态变量，即时编译器编译后的代码等。
运行时常量池：存储类或接口中的数值字面量，字符串字面量以及所有方法或字段的引用，基本上涉及到方法或字段，JVM 就会在运行时常量池中搜索其具体的内存地址
本地方法栈：与 JVM 栈类似，只不过服务于 Native 方法。会抛出StackOverflowError 和OutOfMemoryError。

1.3，执行引擎

运行时数据区存储着要执行的字节码，执行引擎将会读取并逐个执行。

Interpreter - 解释器，它对字节码的解释很快，但执行慢，有个缺点是，当方法被多次调用时，每次都需要重新解释。

JIT Compiler- JIT编译器，解决了解释器的缺点，仍使用解释器来转换字节代码，但发现有代码重复执行时，会使用 JIT 编译器，将整个字节码编译成本地代码，将本地代码用于重复调用，从而提高系统的性能，有以下几部分组成：

中间代码生成器 - 生成中间代码
代码优化器 - 负责优化上面生成的中间代码
目标代码生成器 - 负责生成机器代码或本地代码
Profiler - 一个特殊组件，负责查找热点，判断该方法是否被多次调用

Garbage Collector- 垃圾收集器，收集和删除未引用的对象。

另外，还包括执行引擎所需的本地库(Native Method Libraries)和与其交互的 JNI 接口(Java Native Interface)。

现在来看下 Java 内存模型和 JVM 内存结构有何不同。

二，JVM内存结构

常说的 JVM 内存结构指的就是上文提交到运行时数据区，其中堆、方法区被线程共享，程序计数器、栈（java虚拟机栈和本地方法中栈）、运行时常量池被线程独享。

它描述的是，在运行时，字节码和代码数据存储的位置。

三，内存模型

先抛开 Java 不说，先来看下内存模型是什么？维基百科中的定义：

In computing, a memory model describes the interactions of threads through memory and their shared use of the data.

意思就是，在计算中，内存模型描述了多线程如何正确的通过内存进行交互和使用共享数据。换句话说，内存模型约束了处理器对内存的读写。

CPU 和内存之间通常会存在一层或多层高速缓存，这对单处理器可能没问题，但在多处理器系统中，可能就会出现缓存一致性问题，也就是当两个处理器（线程）同时读取相同内存位置会发生什么？什么情况下会看到相同的值？

缓存一致性问题，在并发编程中，又被称作可见性问题。内存模型在处理器级别，为处理器彼此之间对内存写入结果的可见性，定义了充分必要条件：

强内存模型，一般说的是顺序一致性，所有内存操作存在一个全序关系，每个操作都是原子的且立即对所有处理器可见
弱内存模型，不限制处理器的内存操作顺序，而使用特殊指令刷新或者使本地缓存失效，以便看到其他处理器的写入，或使此处理器的写入对其他处理器可见，这些特殊指令被称为内存屏障

大多数处理器不会限制内存操作的顺序，多线程在执行时可能会出现让人困惑和违背直觉的结果。这是因为 CPU 为了充分利用不同类型存储器（寄存器、高速缓存、主存）的总线带宽，会将内存操作重新排序，以无序执行，这个动作称为内存排序或指令重排序。

重排序，也被称为编译器优化和处理器优化，因为它既可以发生在编译期间，也可以发生在 CPU 运行时。为了保证多线程的有序性，需要使用内存屏障禁止重排序。

所以说，内存模型就是在硬件层面描述了使用内存屏障（刷新缓存或禁用指令重排序）解决多线程编程中的可见性和有序性的问题。

3.1，Java 内存模型

讲完了内存模型，我们说说更详细点，也就是在java里面如何处理内存模型的。

Java 内存模型（下文简称 JMM）就是在底层处理器内存模型的基础上，定义自己的多线程语义。它明确指定了一组排序规则，来保证线程间的可见性。

这一组规则被称为 Happens-Before, JMM 规定，要想保证 B 操作能够看到 A 操作的结果（无论它们是否在同一个线程），那么 A 和 B 之间必须满足 Happens-Before 关系：

单线程规则：一段代码在单线程中执行的结果是有序的。注意是执行结果，因为虚拟机、处理器会对指令进行重排序（重排序后面会详细介绍）。虽然重排序了，但是并不会影响程序的执行结果，所以程序最终执行的结果与顺序执行的结果是一致的。故而这个规则只对单线程有效，在多线程环境下无法保证正确性。
监视器锁定规则：这个规则比较好理解，无论是在单线程环境还是多线程环境，一个锁处于被锁定状态，那么必须先执行unlock操作后面才能进行lock操作。
volatile 变量规则：这是一条比较重要的规则，它标志着volatile保证了线程可见性。通俗点讲就是如果一个线程先去写一个volatile变量，然后一个线程去读这个变量，那么这个写操作一定是happens-before读操作的。
线程 start 规则：假定线程A在执行过程中，通过执行ThreadB.start()来启动线程B，那么线程A对共享变量的修改在接下来线程B开始执行后确保对线程B可见。
线程 join 规则：一个线程内的所有动作 happens-before 任意其他线程在该线程 join() 成功返回之前
传递性：如果 A happens-before B, 且 B happens-before C, 那么 A happens-before C

怎么理解 happens-before 呢？如果按字面意思，比如第二个规则，线程（不管是不是同一个）的解锁动作发生在锁定之前？这明显不对。happens-before 也是为了保证可见性，比如那个解锁和加锁的动作，可以这样理解，线程1释放锁退出同步块，线程2加锁进入同步块，那么线程2就能看见线程1对共享对象修改的结果。

Java 提供了几种语言结构，包括 volatile, final 和 synchronized, 它们旨在帮助程序员向编译器描述程序的并发要求，其中：

volatile - 保证可见性和有序性
synchronized - 保证可见性和有序性; 通过管程（Monitor）保证一组动作的原子性
final - 通过禁止在构造函数初始化和给 final 字段赋值这两个动作的重排序，保证可见性（如果 this 引用逃逸就不好说可见性了）