一.JVM的内存结构与内存模型

目录

Java内存结构

JDK1.8之前

JDK1.8之后(hotpot虚拟机的实现)

直接内存

Java 内存模型

指令重排序

JMM 抽象线程和主内存之间的关系

​编辑

Happens-Before规则

参考文献


JVM的内存结构和内存模型是两个很容易混淆的概念,然而这两个术语的内涵却天差地别。

内存结构是指 Jvm 运行时将数据分区域存储,强调对内存空间的划分。

而内存模型(Java Memory Model,简称 JMM )是定义了线程和主内存之间的抽象关系,是在底层处理器内存模型的基础上(确保了正确同步的Java 代码可以在不同体系结构的处理器上正确运行。,定义自己的多线程语义。它明确指定了一组排序规则,来保证线程间的可见性。一句话概述:Java 内存模型描述的是多线程对共享内存修改后彼此之间的可见性。

Java内存结构

JDK1.8之前

(图片来源于JavaGuide)

jvm将虚拟机分为5大区域,程序计数器、虚拟机栈、本地方法栈、java堆、方法区;

  • 程序计数器:线程私有的,是一块很小的内存空间,作为当前线程的行号指示器,用于记录当前虚拟机正在执行的线程指令地址;
    • 程序计数器主要有两个作用:

    • 字节码解释器通过改变程序计数器来依次读取指令,从而实现代码的流程控制,如:顺序执行、选择、循环、异常处理。
    • 在多线程的情况下,程序计数器用于记录当前线程执行的位置,从而当线程被切换回来的时候能够知道该线程上次运行到哪儿了。
  • 虚拟机栈:线程私有的,每个方法执行的时候都会创建一个栈帧,用于存储局部变量表、操作数、动态链接和方法返回等信息,当线程请求的栈深度超过了虚拟机允许的最大深度时,就会抛出StackOverFlowError;

    • 局部变量表 主要存放了编译期可知的各种数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(reference 类型,它不同于对象本身,可能是一个指向对象起始地址的引用指针,也可能是指向一个代表对象的句柄或其他与此对象相关的位置)。
    • 操作数栈 主要作为方法调用的中转站使用,用于存放方法执行过程中产生的中间计算结果。另外,计算过程中产生的临时变量也会放在操作数栈中。
    • 动态链接 主要服务一个方法需要调用其他方法的场景。在 Java 源文件被编译成字节码文件时,所有的变量和方法引用都作为符号引用(Symbilic Reference)保存在 Class 文件的常量池里。当一个方法要调用其他方法,需要将常量池中指向方法的符号引用转化为其在内存地址中的直接引用。动态链接的作用就是为了将符号引用转换为调用方法的直接引用。

  • 本地方法栈:线程私有的,保存的是native方法的信息,当一个jvm创建的线程调用native方法
    后,jvm不会在虚拟机栈中为该线程创建栈帧,而是简单的动态链接并直接调用该方法;
  • 堆:java堆是所有线程共享的一块内存,几乎所有对象的实例和数组都要在堆上分配内存,因此该区域经常发生垃圾回收的操作;
  • 方法区:存放已被加载的类信息、常量、静态变量、即时编译器编译后的代码数据。即永久代,在jdk1.8中不存在方法区了,被元数据区替代了,原方法区被分成两部分;1:加载的类信息,2:运行时常量池;加载的类信息被保存在元数据区中,运行时常量池保存在堆中;
    • 当虚拟机要使用一个类时,它需要读取并解析 Class 文件获取相关信息,再将信息存入到方法区。方法区会存储已被虚拟机加载的 类信息、字段信息、方法信息、常量、静态变量、即时编译器编译后的代码缓存等数据

注意:

1.Java 虚拟机规范对于运行时数据区域的规定是相当宽松的。以堆为例:堆可以是连续空间,也可以不连续。堆的大小可以固定,也可以在运行时按需扩展 。虚拟机实现者可以使用任何垃圾回收算法管理堆,甚至完全不进行垃圾收集也是可以的。

2.JDK 1.7 将字符串常量池移动到堆中,原因是:永久代(方法区实现)的 GC 回收效率太低,只有在整堆收集 (Full GC)的时候才会被执行 GC。Java 程序中通常会有大量的被创建的字符串等待回收,将字符串常量池放到堆中,能够更高效及时地回收字符串内存。


 

JDK1.8之后(hotpot虚拟机的实现)

直接内存

直接内存并不是虚拟机运行时数据区的一部分,也不是虚拟机规范中定义的内存区域,但是这部分内存也被频繁地使用。而且也可能导致 OutOfMemoryError 错误出现。这是HotPot虚拟机的实现

运行时常量池、方法区、字符串常量池这些都是不随虚拟机实现而改变的逻辑概念,是公共且抽象的,Metaspace、Heap 是与具体某种虚拟机实现相关的物理概念,是私有且具体的。

Java 内存模型

要想真正理解JMM,首先先来看看指令重排序问题

指令重排序

为了提升执行速度/性能,计算机在执行程序代码的时候,会对指令进行重排序。常见的指令重排序有下面 2 种情况:

1.编译器优化重排 :编译器(包括 JVM、JIT 编译器等)在不改变单线程程序语义的前提下,重新安排语句的执行顺序。

2.指令并行重排 :现代处理器采用了指令级并行技术(Instruction-Level Parallelism,ILP)来将多条指令重叠执行。如果不存在数据依赖性,处理器可以改变语句对应机器指令的执行顺序。

Java 源代码会经历 编译器优化重排 —> 指令并行重排 —> 内存系统重排 的过程,最终才变成操作系统可执行的指令序列。

指令重排序可以保证串行语义一致,但是没有义务保证多线程间的语义也一致 ,所以在多线程下,指令重排序可能会导致一些问题。JMM就是为了解决多线程访问共享变量时的同步问题的

对于 Java 开发者说,你不需要了解底层原理,直接使用并发相关的一些关键字和类(比如 volatilesynchronized、各种 Lock)即可开发出并发安全的程序。

JMM 抽象线程和主内存之间的关系

在当前的 Java 内存模型下,线程可以把变量保存 本地内存 (比如机器的寄存器)中,而不是直接在主存中进行读写。这就可能造成一个线程在主存中修改了一个变量的值,而另外一个线程还继续使用它在寄存器中的变量值的拷贝,造成数据的不一致。

从上图来看,线程 A与线程 B 之间如果要进行通信的话,必须要经历下面 2 个步骤:

  1. 线程 A 把本地内存中修改过的共享变量副本的值同步到主内存中去。
  2. 线程 B 到主存中读取对应的共享变量的值。

也就是说,JMM 为共享变量提供了可见性的保障。

不过,多线程下,对主内存中的一个共享变量进行操作有可能诱发线程安全问题。举个例子:

  1. 线程 A 和线程 B 分别对同一个共享变量进行操作,一个执行修改,一个执行读取。
  2. 线程 B 读取到的是线程 A 修改之前的值还是修改后的值并不确定,都有可能,因为线程 A 和线程 B 都是先将共享变量从主内存拷贝到对应线程的工作内存中。

Happens-Before规则

为了线程间的可见性,JMM定义了 Happens-Before规则, JMM 规定,要想保证 B 操作能够看到 A 操作的结果(无论它们是否在同一个线程),那么 A 和 B 之间必须满足 Happens-Before 关系:

1.单线程规则:一个线程中的每个动作都 happens-before 该线程中后续的每个动作

2.监视器锁定规则:监听器的解锁动作 happens-before 后续对这个监听器的锁定动作

3.volatile 变量规则:对 volatile 字段的写入动作 happens-before 后续对这个字段的每个读取动作

4.线程 start 规则:线程 start() 方法的执行 happens-before 一个启动线程内的任意动作

5.线程 join 规则:一个线程内的所有动作 happens-before 任意其他线程在该线程 join() 成功返回之前
6.传递性:如果 A happens-before B, 且 B happens-before C, 那么 A happens-before C
 

参考文献

  • 《深入理解 Java 虚拟机:JVM 高级特性与最佳实践(第二版》
  • JavaGuide
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
JVMJava虚拟机)内存模型Java程序运行时的内存分配和管理方式。它包括了不同的内存区域,每个区域都有不同的作用和生命周期。下面是JVM内存模型的底层原理: 1. 程序计数器(Program Counter Register):程序计数器是一块较小的内存区域,它保存着当前线程执行的字节码指令的地址。在多线程环境下,每个线程都有自己独立的程序计数器,互不影响。 2. Java虚拟机栈(Java Virtual Machine Stacks):每个线程在运行时都会创建一个栈,用于存储局部变量、方法参数、返回值和方法调用的信息。栈是线程私有的,它的生命周期与线程相同。 3. 本地方法栈(Native Method Stack):本地方法栈与Java虚拟机栈类似,但是它为本地方法(使用其他语言编写的方法)服务。 4. Java堆(Java Heap):Java堆是Java虚拟机管理的最大的一块内存区域,用于存储对象实例。所有的对象实例和数组都在堆上分配内存。 5. 方法区(Method Area):方法区用于存储类的结构信息,包括类的字段、方法、构造方法、接口等。方法区也包含运行时常量池,用于存储编译期生成的各种字面量和符号引用。 6. 运行时常量池(Runtime Constant Pool):运行时常量池是方法区的一部分,用于存储编译期生成的各种字面量和符号引用。 7. 直接内存(Direct Memory):直接内存并不是虚拟机运行时数据区的一部分,它是在堆外分配的内存,通过使用ByteBuffer类来操作。直接内存的分配不受Java堆大小的限制,但是它的分配和释放需要手动管理。 以上是JVM内存模型的底层原理。通过合理地管理和优化这些内存区域,可以提高Java程序的性能和稳定性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值