JVM体系结构

1. JVM简介

1.1 什么是JVM

        JVM(Java Virtual Machine)是Java平台的核心组件之一。它是一个运行Java字节码(Java bytecode)程序的虚拟机,是Java程序跨平台运行的基石。

        JVM的主要功能如下:

        1、Java字节码执行:JVM可以解释和执行Java字节码,将Java程序转换为底层操作系统能够理解和执行的指令。

        2、类加载:JVM的类加载器(Class Loader)负责将Java类加载到内存中,并解决类之间的依赖关系。

        3、内存管理:JVM负责管理Java程序的内存分配和回收。

        4、异常处理:JVM提供了异常处理机制,允许程序在出现异常情况时进行捕获、处理和传播。

        5、多线程支持:JVM提供了线程调度机制,可以协调线程之间的执行顺序,实现并发和并行执行。

1.2 主流JVM实现

        JVM是一种规范,不同公司基于JVM规范提供了多种实现。目前市场上存在几个主流的JVM实现:

        1、Oracle HotSpot JVM:HotSpot JVM是Oracle官方开发和维护的JVM实现,也是最广泛使用的JVM之一。

        2、OpenJDK:OpenJDK是一个开源的JVM实现,由Oracle主导开发并在GPL许可下发布。它与Oracle HotSpot JVM有密切的关联,事实上,Oracle HotSpot JVM的源代码就是基于OpenJDK的。

        3、Eclipse OpenJ9:OpenJ9是一个由IBM开发的JVM实现,它具有卓越的内存管理和优化技术。

        4、Azul Zing JVM:Zing JVM是由Azul Systems开发的一款商业JVM实现,专注于高性能和可预测性。

1.3 为什么要学习JVM

        Java开发者学习JVM相关知识是非常重要的,以下是一些原因:

        1、内存管理和优化:JVM负责Java程序的内存管理。了解JVM内存模型、不同类型的内存区域以及垃圾回收算法,可以帮助开发者有效地管理内存,并避免内存泄漏和性能问题。

        2、性能调优:JVM是Java程序的执行引擎,通过了解垃圾回收机制、即时编译器和内存管理等方面的知识,开发者可以识别和解决潜在的性能瓶颈,并进行合理的性能调优。

        3、多线程编程:JVM对多线程编程提供了支持,了解线程之间共享数据的规则、内存模型和可见性等概念,以及JVM提供的锁的优化技术,可以帮助开发者编写高效、稳定的多线程应用程序。

1.4 Java代码的执行过程

        从Java源代码(.java文件)到主机执行Java程序,这其中的过程可以分为两个阶段,即编译阶段(Compile Time)和运行阶段(Runtime)。

        1、编译阶段(Compile Time)

  • 在编译阶段,Java源代码(.java文件)被编译器(javac)转换成字节码文件(.class文件)
  • 编译器会对源代码进行词法分析、语法分析和语义分析,并生成对应的字节码指令

        2、运行阶段(Runtime)

  • 在运行阶段,Java虚拟机(JVM)负责将机器无关的字节码转换为机器相关的机器码,然后再交给操作系统来执行

1.5 解释器和JIT技术

        在JVM(Java虚拟机)中,解释器(Interpreter)和JIT(Just-In-Time)编译器是两个关键的组件,用于执行Java字节码并优化程序的执行效率。

        1、解释器:负责逐条解释执行Java字节码指令

  • 解释器的执行速度相对较慢,因为它需要将字节码指令转换成实际的机器码并执行

        2、JIT(Just In Time)编译器:它通过将热点代码(Hot Spot,即经常执行的代码)编译成本地机器码来提高程序的执行速度

  • JIT编译器在运行阶段监测程序的执行情况,找出被频繁执行的代码段,并将其编译成本地机器码并缓存起来,以备下次使用
  • 通过即时编译,可以避免每次执行都需要解释字节码的开销,提高程序的执行速度
  • JIT编译器还可以进行各种优化,如逃逸分析、锁消除、锁膨胀、方法内联、空值检查消除等,进一步提升代码的性能

        在JVM中,采用的是解释器与编译器搭配使用的方式,即混合模式,可以通过java -version查询到这一信息。

        上图中的mixed mode表示正在使用混合模式。

1.6 热点检测方法

        JIT(Just-In-Time)编译器在JVM(Java虚拟机)中通过识别热点代码来进行动态编译优化。以下是几种常见的热点检测(Hot Spot Detection)方法:

        1、基于采样的方式探测(Sample Based Hot Spot Detection):周期性检测各个线程的栈顶,发现某个方法经常出现在栈顶,就认为是热点方法。

  • 优点:逻辑简单
  • 缺点:无法精确确认一个方法的热度,容易受线程阻塞或其他因素影响

        2、基于计数器的热点探测(Counter Based Hot Spot Detection)。采用这种方法的虚拟机会为每个方法,甚至是代码块建立计数器,统计方法的执行次数,某个方法超过阀值就认为是热点方法,触发JIT编译。

        在HotSpot虚拟机中使用的是第二种:基于计数器的热点探测方法。它为每个方法准备了两个计数器:

  • 方法计数器:记录一个方法被调用次数的计数器
  • 回边计数器:记录方法中的for或者while的运行次数的计数器

2. JVM的结构

2.1 JVM的架构

        JVM的整体架构(Java Hotspot Architecture)主要包含三大部分,分别是类加载系统 (Class Loader Subsystem),运行时数据区 (Runtime Data Area)和执行引擎 (Execution Engine)。

        1、类加载系统(Class Loader Subsystem):负责将Java类加载到JVM中,并将字节码转换为可执行的类定义。

        2、运行时数据区(Runtime Data Area):是JVM的内存管理区域,用于存储程序运行时的数据。它主要包括以下几个部分:

  • 方法区(Method Area):存储类的结构信息、静态变量、常量池等,是各个线程共享的内存区域
  • 堆(Heap):存储对象实例,是JVM中最大的一块内存区域,用于动态分配对象的内存空间
  • 栈(Stack):存储方法调用和局部变量;每个线程都有自己的栈,用于保存方法的调用栈帧和局部变量表
  • 本地方法栈(Native Method Stack):用于执行本地方法,类似于栈,但是专门用于执行本地方法

        3、执行引擎(Execution Engine):负责执行Java字节码指令,将其转换为机器码并执行。它主要包括以下几个组件:

  • 解释器(Interpreter)
  • 即时编译器(Just-In-Time Compiler,JIT)
  • 垃圾收集器(Garbage Collector):负责自动回收不再使用的对象内存,并释放资源

2.2 JVM运行时内存结构

        JVM 启动运行Class文件时会对JVM内存进行切分,我们可以将其分为线程共享区和线程独享区,如下图所示:

        1、堆(Heap):堆是JVM中最大的一块内存区域,用于存储对象实例。

  • 所有通过new关键字创建的对象都存放在堆中
  • 堆在JVM启动时被创建,并被所有线程共享
  • 它被划分为不同的区域,如新生代(Young Generation)、老年代(Old Generation)等
  • 堆的大小可以通过JVM参数进行调整

        2、方法区(Method Area):方法区用于存储类的结构信息、静态变量、常量池等数据。

  • 它在JVM启动时被创建,并被所有线程共享
  • 在方法区中,每个类都有一个运行时常量池,用于存储字面量、符号引用和其他常量

        3、栈(Stack):栈用于存储方法调用和局部变量。

  • 每个线程都有自己的栈,栈的生命周期与线程的生命周期相同
  • 每当一个方法被调用时,JVM会创建一个栈帧(Stack Frame),用于保存方法的局部变量、操作数栈、方法返回地址等信息
  • 栈帧的大小在编译时确定

        4、本地方法栈(Native Method Stack):本地方法栈类似于栈,但是专门用于执行本地方法(Native Method)。

  • 本地方法是使用其他编程语言(如C、C++)编写的方法,通过Java的本地方法接口(JNI)与JVM交互
  • 本地方法栈的大小在JVM参数中设置

        5、PC寄存器(Program Counter Register):PC寄存器用于保存当前线程正在执行的字节码指令的地址。

  • 每个线程都有自己的PC寄存器,当线程切换时,PC寄存器也会切换到新线程的当前指令

2.3 不同版本的方法区实现

        在JVM 6、7和8中,方法区的实现方式有所不同。

        1、JVM 6中的方法区实现方式:JVM 6及之前的版本中,方法区被实现为永久代(Permanent Generation)。

  • 永久代是堆的一个特殊区域,用于存储类的结构信息、静态变量、常量池等
  • 它是一个固定大小的内存区域,在JVM启动时被分配。永久代的大小可以通过JVM参数进行配置

        然而,永久代存在一些问题:

  • 永久代的大小在JVM启动时就需要确定,并且无法动态调整。这可能导致在应用程序运行时,如果方法区需要更多的内存来存储类的结构信息和常量池等数据,就会发生永久代溢出的问题。
  • 永久代的垃圾回收(GC)机制比较简单,容易出现内存泄漏或不可预测的GC暂停时间。

        2、JVM 7中的方法区实现方式:在JVM 7中,对永久代进行了一些优化和改进,以减少永久代的压力,提高内存的利用率。

  • 字符串常量池被移动到堆中
  • 静态变量被移动到堆中

        3、JVM 8中的方法区实现:JVM 8彻底改变了方法区的实现方式,取而代之的是元空间(Meta Space),元空间提供了更灵活和可管理的方法区实现,提高了JVM的性能和可扩展性。

  • 元空间用于存储类的元数据信息,包括类的结构、方法信息、常量池等
  • 元空间不再使用JVM堆内存,而是使用本地内存(Native Memory)
  • 元空间的大小可以根据应用程序的需要进行动态调整,不再受JVM堆大小的限
  • 元空间的分配和回收不再依赖于垃圾收集器,而是由本地内存管理。

2.4 TLAB

        TLAB(Thread-Local Allocation Buffer)是Java虚拟机中的一种内存分配机制,用于提高多线程环境下的对象分配性能。

        在Java中,对象的分配通常是在堆上进行的,而在多线程环境下,多个线程同时进行对象分配可能会导致竞争和锁的开销,从而影响性能。为了解决这个问题,JVM引入了TLAB机制。

        每个线程都拥有自己的TLAB,它是堆(Heap)上的一块小内存区域。TLAB的作用是让线程在自己的TLAB上进行对象分配,而不必竞争全局的分配锁。每个线程的TLAB相互独立,线程可以自由地在自己的TLAB上分配对象,避免了锁的竞争。

        堆是线程共享的内存区域”这句话并不完全正确,因为TLAB是堆内存的一部分,它在读取上确实是线程共享的,但是在内存分配上,是线程独享的。

        需要注意的是,TLAB的大小是有限的,并且会根据对象分配的情况进行动态调整。如果一个线程的TLAB不够用,它仍然可以从全局堆中分配对象,但这时会涉及到竞争和同步操作。

2.5 堆和栈的区别

        堆和栈是Java程序运行过程中主要存储区域,经常被拿来对比,他们主要有以下区别(这里的栈主要指的是虚拟机栈) 。

        1、内存分配方式

  • 堆:堆是用于存储对象实例的内存区域。在Java中,所有的对象实例都在堆上分配内存。
  • 栈:栈是用于存储方法调用和局部变量的内存区域。每个线程在执行方法时都会创建一个栈帧,用于存储方法的参数、局部变量和返回值等。

        2、线程共享方式

  • 堆是线程共享
  • 栈是线程独享

        3、内存管理方式

  • 堆:堆内存的分配和释放是由JVM的垃圾回收机制自动管理的。
  • 栈:栈上的内存分配和释放是由程序的执行流程控制的,当方法执行完毕时,栈帧被销毁,分配给该方法的内存空间也随之释放。

        4、内存空间大小

  • 堆:堆是JVM中最大的内存区域之一,它的大小可以通过启动参数进行配置。
  • 栈:栈的大小相对较小,并且是固定的,一般在几百到几千字节。

2.6 堆的分代 

        Java的堆内存分代是指将不同生命周期的堆内存对象存储在不同的堆内存区域中,这里的不同的堆内存区域被定义为“代”(Generation)。堆的分代是一种内存管理策略,通过为不同的代设置不同的回收策略,提高垃圾回收的效率。

        一般来说,Java中的大部分对象都是朝生夕死的,同时也有一部分对象会持久存在。将不同时期的对象存储在不同的内存池中,可以节省宝贵的时间和空间,从而改善系统的性能。

        Java的堆由新生代 (Young Generation) 和老年代(Old Generation) 组成。新生代存放新分配的对象,老年代存放长期存在的对象。

        1、新生代:由伊甸园区(Eden Space) 和幸存者区 (Survivor Space) 组成。

  • Eden Space:作为对象分配的初始空间,大多数新创建的对象都会被分配到这里。
  • Survivor Space:用于存储经过一次垃圾回收仍然存活的对象。新生代中有两个相等大小的Survivor Space,其中一个被标记为From,另一个被标记为To。
  • 垃圾回收机制:新生代采用复制算法进行垃圾回收。

        2、老年代:在新生代中经历多次垃圾回收后,仍然存活的对象会被晋升到老年代。

  • 垃圾回收机制:老年代采用标记-清除(Mark-Sweep)和标记-整理(Mark-Compact)等算法进行垃圾回收。

2.7 JVM参数-设置内存区域大小

        在Java应用程序中,可以使用各种JVM参数来配置虚拟机的行为和性能。

        堆内存大小相关:

  • -Xms:用于设置堆的初始内存大小,例如,-Xms512m表示将堆的初始内存设置为512MB
  • -Xmx:用于设置堆的最大内存大小,例如,-Xmx2g表示将堆的最大内存设置为2GB
  • -XX:NewSize:设置新生代最小空间大小
  • -XX:MaxNewSize:设置新生代最大空间大小
  • -XX:SurvivorRatio: 用于设置新生代中Eden区与Survivor区的大小比例,值为8表示Eden和两个Survivor的比例为8: 2
  • -XX:NewRatio:用于设置新生代与老年代的大小比例

        方法区大小相关:

  • -XX:MetaspaceSize:用于设置元空间的初始大小(JDK 8)
  • -XX:MaxMetaspaceSize:用于设置元空间的最大大小(JDK 8)
  • -XX:PermSize:用于设置永久代的初始大小(仅在JDK 7及更早版本中有效)
  • -XX:MaxPermSize:用于设置永久代的最大内存大小(仅在JDK 7及更早版本中有效)

        栈大小相关:

  • -Xss:用于设置线程栈的大小,默认值通常是1MB

        在IDEA中新建一个普通的Java项目,在src/main/java文件夹下新建一个TestOOM01类,代码如下:

public class TestOOM01 {
    public static void main(String[] args) {
        // 创建一个集合,用来保存所有的byte数组
        List<byte[]> list = new ArrayList<>();
        // 向集合中添加100个byte数组,每个数组的大小为1M
        for (int i = 0; i < 100; i++) {
            list.add(new byte[1024 * 1024]);
        }
    }
}

点击main方法前的播放键,运行一次程序,此时不会出现内存溢出。

在IDEA中的Edit Configurations中为程序添加VM参数:

        参数如下:

-Xmx50m -Xms10m -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=d:/a.dump

  • -Xms10m:设置堆起始内存为10MB
  • -Xmx50m:设置堆最大内存为50MB
  • -XX:+HeapDumpOnOutOfMemoryError:表示当JVM发生OOM时,自动生成DUMP文件
  • -XX:HeapDumpPath=d:/a.dump:表示生产dump文件的路径和文件名,如果不指定文件名,默认为java_heapDump.hprof

        Dump文件是指在程序运行过程中产生的内存转储文件,也称为堆转储文件或快照文件。它记录了应用程序在某个特定时刻的内存状态,包括对象实例、堆内存的使用情况、线程信息等。Dump文件通常用于分析和调试应用程序在内存管理方面的问题,如内存泄漏、内存溢出等。

        基于上述VM参数运行程序,会出现内存溢出问题,运行效果如下图所示:

        接下来,可以使用第三方工具VisualVM来查看Dump文件的内容。VisualVM是一款功能强大的Java虚拟机(JVM)监控和分析工具,它提供了可视化界面来监视和诊断Java应用程序。

        选择File -> Load…,导入本地的D:/a.dump文件。

        导入成功后,可以看到VM中被大量的byte[]占满:

3. 总结

        1、JVM(Java Virtual Machine)是Java平台的核心组件之一

  • 它是一个运行Java字节码(Java bytecode)程序的虚拟机,是Java程序跨平台运行的基石

        2、从Java源代码(.java文件)到主机执行Java程序,这其中的过程可以分为两个阶段,即编译阶段(Compile Time)和运行阶段(Runtime)

  • 在编译阶段,Java源代码(.java文件)被编译器(javac)转换成字节码文件(.class文件)
  • 编译器会对源代码进行词法分析、语法分析和语义分析,并生成对应的字节码指令
  • 在运行阶段,Java虚拟机(JVM)负责将机器无关的字节码转换为机器相关的机器码,然后再交给操作系统来执行

        3、在JVM(Java虚拟机)中,解释器(Interpreter)和JIT(Just-In-Time)编译器是两个关键的组件,用于执行Java字节码并优化程序的执行效率

  • 解释器:负责逐条解释执行Java字节码指令
  • JIT(Just In Time)编译器:它通过将热点代码(Hot Spot,即经常执行的代码)编译成本地机器码来提高程序的执行速度

        4、编译器在JVM(Java虚拟机)中通过识别热点代码来进行动态编译优化

  • 在HotSpot虚拟机中使用的是第二种:基于计数器的热点探测方法
  • 它为每个方法准备了两个计数器:方法调用计数器和回边计数器

        5、JVM的整体架构(Java Hotspot Architecture)主要包含三大部分,分别是类加载系统 (Class Loader Subsystem),运行时数据区 (Runtime Data Area)和执行引擎 (Execution Engine)

        6、JVM 启动运行Class文件时会对JVM内存按照功能切分成不同的区域

  • 堆(Heap):堆是JVM中最大的一块内存区域,用于存储对象实例
  • 方法区(Method Area):方法区用于存储类的结构信息、静态变量、常量池等数据
  • 栈(Stack):栈用于存储方法调用和局部变量
  • 本地方法栈(Native Method Stack):本地方法栈类似于栈,但是专门用于执行本地方法
  • PC寄存器(Program Counter Register):PC寄存器用于保存当前线程正在执行的字节码指令的地址

        7、在JVM 6、7和8中,方法区的实现方式有所不同

  • 在JVM 6及之前的版本中,方法区被实现为永久代(Permanent Generation)
  • 在JVM 7中,对永久代进行了一些优化和改进,以减少永久代的压力,提高内存的利用率
  • JVM 8彻底改变了方法区的实现方式,取而代之的是元空间(Meta Space)

        8、TLAB(Thread-Local Allocation Buffer)是Java虚拟机中的一种内存分配机制,用于提高多线程环境下的对象分配性能

        9、Java的堆由新生代 (Young Generation) 和老年代(Old Generation) 组成

  • 新生代:存放新分配的对象,由伊甸园区(Eden Space) 和幸存者区 (Survivor Space) 组成
  • 老年代:存放长期存在的对象,在新生代中经历多次垃圾回收后,仍然存活的对象会被晋升到老年代

  • 17
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Java体系结构特性主要包括跨平台性、安全性、简单性和可移植性。 首先是跨平台性,即Java程序可以在不同的操作系统上运行。这是因为Java程序在编译时会被转换成字节码而不是机器码,而字节码可以由Java虚拟机(JVM)来解释执行。不同的操作系统只需要安装相应的JVM即可运行相同的Java程序,极大地提高了程序的可移植性。 其次是安全性,Java引入了一系列安全机制来保护计算机和网络的安全。Java的安全性主要通过字节码校验、安全沙箱和安全管理器来实现。字节码校验可以检查Java程序的合法性,以防止恶意代码的执行;安全沙箱可以限制Java程序对计算机资源的访问,确保程序不能越权操作;安全管理器可以定义安全策略,对程序的访问进行控制。 再次是简单性,Java的设计目标之一就是简单易学。Java的语法相对简单,去除了C++中复杂的特性,同时提供了垃圾回收和自动内存管理等功能,减轻了程序员的工作负担。Java还提供了丰富的类库,使得开发人员能够更加便捷地编写代码。 最后是可移植性,即Java程序可以在不同的硬件和操作系统上运行。通过Java虚拟机的存在,Java程序不需要针对特定的硬件和操作系统进行优化和适配,使得程序的移植性非常好,减少了开发人员的工作量。 综上所述,Java体系结构特性的跨平台性、安全性、简单性和可移植性使得Java成为一种广泛应用于各种领域的编程语言。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

zhangyan_1010

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值