一、什么是Java虚拟机
JVM是Java Virtual Machine(Java虚拟机)的缩写,JVM是一种用于计算设备的规范,它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息,使Java程序只需生成在Java虚拟机上运行的目标代码(字节码),就可以在多种平台上不加修改地运行。JVM在执行字节码时,实际上最终还是把字节码解释成具体平台上的机器指令执行。使用JVM就是为了支持与操作系统无关,实现跨平台。
Java编译器只要面向JVM,生成JVM能理解的代码或字节码文件。Java源文件经编译成字节码程序,通过JVM将每一条指令翻译成不同平台机器码,通过特定平台运行。
二、JVM体系结构
1.类加载机制(Class Loader):类加载子系统是根据一个类的全限定名来加载该类的二进制流到内存中,在JVM 中将形成一份描述 Class 结构的元信息对象(方法区),通过该元信息对象可以获知 Class 的结构信息:如构造函数,属性和方法等,Java 允许用户借由这个 Class 相关的元信息对象间接调用 Class 对象的功能。
2.运行时数据区:经过编译生成的字节码文件(class文件),由 class loader(类加载子系统)加载后交给执行引擎执行。在执行引擎执行的过程中产生的数据会存储在一块内存区域。这块内存区域就是运行时区域
-
程序计数器:用于记录当前线程的正在执行的字节码指令位置。由于虚拟机的多线程是切换线程并分配 cpu 执行时间的方式实现的,不同线程的执行位置都需要记录下来,因此程序计数器是线程私有的
-
虚拟机栈:虚拟机栈是 Java 方法执行的内存结构,虚拟机会在每个 Java 方法执行时创建一个“栈桢”,用于存储局部变量表,操作数栈,动态链接,方法出口等信息。当方法执行完毕时,该栈桢会从虚拟机栈中出栈。其中局部变量表包含基本数据类型和对象引用
- 在 Java 虚拟机规范中,对这个区域规定了两种异常状态:如果线程请求的栈的深度大于虚拟机允许的深度,将抛出 StackOverFlowError 异常(栈溢出),如果虚拟机栈可以动态扩展(现在大部分 Java 虚拟机都可以动态扩展,只不过 Java 虚拟机规范中也允许固定长度的 Java 虚拟机栈),如果扩展时无法申请到足够的内存空间,就会抛出 OutOfmMemoryError 异常(没有足够的内存)
-
本地方法栈:类似 Java 方法的执行有虚拟机栈,本地方法的执行则对应有本地方法栈
-
方法区:用于存储已被虚拟机加载的类信息,常量,静态变量,即时编译器编译后的代码等数据。线程共享(看存储的数据就知道了)
-
Java 堆(Heap):堆的主要作用是存放程序运行过程中创建的对象实例,因为要存放的对象实例有可能会极多,因此也是虚拟机内存管理中最大的一块。并且由于硬件条件有限,所以需要不断回收已“无用”的实例对象来腾出空间给新生成的实例对象;因此 Java 的垃圾回收主要是针对堆进行回收的(还有方法区的常量池),Java 堆很多时候也被称为GC堆(Garbage Collected Heap)。
三、JVM是如何工作的?
如上面的体系结构图所示,JVM 分为三个主要的子系统:
类装载器(ClassLoader)(用来装载.class文件)
执行引擎(执行字节码,或者执行本地方法)
运行时数据区(方法区、堆、java栈、PC寄存器、本地方法栈)
1、类加载器子系统
Java的动态类加载功能是由类加载器子系统处理的。它负责加载、链接,并且在运行时首次引用类的时候初始化类,而不是在编译期间。
1.1、加载
这个组件负责加载类。BootStrap类加载器、Extension类加载器和Application类加载器是实现这个功能的三大类加载器。
- BootStrap类加载器 —— 负责从classpath加载类,如果没有类存在,将只加载rt.jar。这个加载器的优先级最高。
- Extension类加载器 —— 负责加载**扩展文件夹(jre\lib)**中的类。
- Application类加载器 —— 负责加载应用级classpath和环境变量指向的路径下的类。
上述类加载器在加载类文件时遵循委托层次结构算法。
1.2、链接
- 校验 —— 字节码验证器将校验生成的字节码是否正确,如果校验失败,我们将获得校验错误信息。
- 准备 —— 对于所有的静态变量,内存将被申请并分配默认值。
- 解析 —— 所有标记的内存引用从方法区域被替换成的原始引用。
1.3、初始化
这是类加载的最后阶段,所有的静态变量都将被分配原值,静态代码块将被执行。
2.运行时数据区:
经过编译生成的字节码文件(class文件),由 class loader(类加载子系统)加载后交给执行引擎执行。在执行引擎执行的过程中产生的数据会存储在一块内存区域。这块内存区域就是运行时区域
运行时数据区被划分为五个主要部分:
- 方法区 —— 所有类级数据都将存储在这里,包括静态变量。每一个JVM只有一个方法区,并且它是一个共享资源。
- 堆区 —— 所有对象及其对应的实例变量和数组等存储在此,每个JVM同样只有一个堆区。由于方法区和堆区是多线程内存共享,因此存储的数据是非线程安全的。
- 栈区 —— 每个线程都会创建一个单独的运行时栈。在每一次方法调用,都会在栈内存中创建一个栈帧(Stack Frame)。所有局部变量将在栈内存中创建。栈区是线程安全的,因为它不是一个共享资源。栈帧可以被划分为三个实体:
局部变量数组 —— 与方法中有多少局部变量有关,相应的值将存储在此处。 操作数栈 —— 如果任何的中间操作需要被执行,操作数栈将作为运行时工作区来执行操作。 帧数据 —— 与方法相对应的所有符号存储在此。在任何异常情况下,catch块的信息被保留在帧数据中。
- PC寄存器 —— 每一个线程都有单独的PC寄存器,一旦执行指令,PC寄存器将被下一条指令更新,保存当前执行指令的地址。
- 本地方法栈 —— 本地方法栈保存本地方法信息,每一个线程都会创建一个单独的本地方栈。
3、执行引擎
-
分配到运行时数据区的字节码将被执行引擎执行。执行引擎读取字节码并逐一执行。
- 解释器 —— 解释器能更加快速地解释字节码,但是执行缓慢。解释器的缺点是当多次调用一个方法时,每次都要重新解释。
- JIT编译器 —— JIT编译器弥补了解释器的不足。执行引擎使用解释器来转换字节码,当它发现重复的代码时,它将使用JIT编译器来编译整个字节码并转换为本地代码。本地代码将直接被重复的方法所调用,从而提高系统性能。
- 中间代码生成器 —— 生成中间代码。
- 代码优化器 —— 负责优化上述生成的中间代码。
- 目标代码生成器 —— 负责生成机器码或者本地代码。
- 分析器 —— 一个特殊的组件,负责查找热点代码,比如一个方法是否被调用多次。
- 垃圾回收器 —— 回收并删除未引用的对象。可以通过调用**System.gc()**来触发垃圾回收,但不能保证它执行。JVM的垃圾回收是回收被创建的对象。
-
Java本地接口(JNI):JNI与本地方法库交互,并为执行引擎提供本地方法库。
本地方法库(Native Method Libraries):它是执行引擎所需的本地库集合。