【JVM】感觉弗如...类加载机制-CSDN博客

本文链接：https://blog.csdn.net/2301_79344902/article/details/138753764

【JVM】感觉弗如…类加载机制

在Java开发过程中，从源代码（.java文件）到字节码（.class文件）再到运行时的类加载，会经历几个关键步骤，我们先简单过一遍大体的过程。再介绍今天这篇博客的重点内容——类加载机制。

本篇博客配图大部分源自：

【JVM】Java类加载机制这块算是玩明白了_哔哩哔哩_bilibili

.java文件从编译到运行

1. 编写源代码（.java文件）

Java开发者使用文本编辑器或集成开发环境（IDE）编写源代码。源代码是Java语言编写的程序，包含了类定义、方法定义、变量声明等。

简单来说就是我们写在编译器里面的东西.jpg

2. 编译源代码

编写完源代码后，需要通过Java编译器将源代码编译成字节码。这个过程由javac命令触发：

javac MyClass.java

编译过程涉及以下步骤：

词法分析：编译器读取源代码文件，将其分解成一系列的词法单元（tokens），如关键字、标识符、符号等。
语法分析：编译器检查词法单元的排列顺序是否符合Java语言的语法规则。
语义分析：编译器检查代码的语义，如类型检查、变量作用域等。
生成字节码：编译器将经过分析的源代码转换成Java虚拟机的字节码指令。

简单来说就是将人类可读的Java源代码转换成JVM可执行的字节码。

3. 生成字节码（.class文件）

编译过程结束后，会生成一个或多个.class文件，每个.class文件对应源代码中的一个公共类（public class）。字节码是JVM能够理解的中间代码，包含了Java源代码的执行逻辑，但不包含任何特定于硬件平台的指令。（这也是Java跨平台的基础机制之一）

4. 运行Java程序

生成.class文件后，可以使用java命令来运行程序：

java MyClass

运行过程涉及以下步骤：

加载：JVM的类加载器负责加载.class文件到JVM中，创建java.lang.Class对象。
链接：链接过程包括验证字节码的合法性、为静态变量分配内存并设置默认值、将符号引用转换为直接引用。
初始化：执行类构造器<clinit>()方法，初始化静态变量和静态代码块。
执行：JVM开始执行程序的main方法，程序按照编写的逻辑运行。

5. 类加载阶段发生的时机

了解过java的编译运行流程，仍有一点不清楚，类加载阶段究竟发生在什么时候？是在进入main方法之前？还是在使用类前？接下来我们罗列几个常见的类加载机制出现的时机：

首次使用类时：在程序运行期间，当某个类被首次主动使用时，JVM会开始这个类的加载阶段。主动使用的情况包括但不限于创建类的实例、访问某个类的静态变量、调用类的静态方法等。
通过类加载器显式加载：当通过Java类加载器（如java.lang.ClassLoader的子类）显式加载一个类时，也会触发该类的加载阶段。
由其他类引用：当一个类在运行时使用了另一个类，JVM可能需要加载并初始化那个被使用的类。
初始化某个类的子类：如果一个类的子类被加载，其父类还未被加载，JVM会先加载父类。
调用类的静态方法：在调用一个类中的静态方法时，该类会被加载。

示例如上，我们编写了一个用于测试的DemoTest类，一个TestHaHa类，在main中调用TestHaHa的静态方法，即使用了TestHaHa类，此时触发类加载机制，加载了TestHaHa中的静态代码块。

其余示例由于篇幅原因，不在本篇博客中作展示。

类从加载到使用

下图展示了Java类生命周期的主要阶段，包括编译、加载、连接、初始化、使用和卸载。，由于类加载只包括加载、链接、初始化三个过程，故而本篇博客暂时不会提及最终的卸载环节。

想了想还是把简单的概述放在这里吧~

卸载：当类不再被使用时，由JVM的垃圾回收器卸载。

1. 加载

加载是一个读取Class文件，将其转化为某种静态数据结构存储在方法区内，并在堆中生成一个便于用户调用的java.lang.Class类型的对象的过程。

通过类的全限定名查找类：JVM通过类加载器查找.class文件或提供.class文件的网络资源。
将.class文件的二进制数据读入JVM：这些数据被存储在方法区内。
在堆区创建java.lang.Class对象：每个类在JVM中都有唯一对应的Class对象，用于表示类在JVM的状态。

注1：此处的Class文件并不一定指的是本地文件，而是泛指各种来源的二进制流（网络、数据库、及时生成的Class文件）

注2：全限定名：

全限定名通常由以下两部分组成：

包名（Package Name）：类或接口所属的包的名称，用句点（.）分隔。
类名或成员名（Class or Member Name）：类的简单名称或接口的简单名称，以及可能的方法名和字段名。

假设有一个名为MyClass的类，它位于名为com.example的包中，那么它的全限定名将是：
com.example.MyClass
如果MyClass类中有一个名为myMethod的方法，这个方法的全限定名将是：
com.example.MyClass.myMethod

2. 验证

首先对文件格式进行验证（发生于加载阶段）
而后对元数据和字节码进行验证（即对Class静态结构进行语法和语义上的分析，保证其不会产生危害虚拟机的行为）
对符号引用进行验证（在解析阶段进行）

3. 准备

准备阶段是在字节码验证通过之后，虚拟机会认为该Class是安全的，此时将会进入准备阶段。

准备阶段做的处理其实不复杂，就是为类分配静态变量的内存，并设置默认初始值。例如，对于基本数据类型，int会被初始化为0，对象引用会被初始化为null。

这里仅仅是静态变量，而不是成员变量。

在准备阶段的介绍中，我们简单了解方法区。

在JDK 8之前，方法区通常与永久代（Permanent Generation，PermGen）联系在一起。在JDK 8及以后弃用了永久代这种实现方式，采用**元空间（Metaspace）**这种直接内存来取代。

永久代与元空间的区别：

永久代是堆内存中的一部分，用于存储类元数据。但是，由于永久代的大小是固定的，这可能导致内存溢出问题。

元空间位于本地内存（Native Memory），而不是堆内存。这意味着元空间的大小只受限于本地内存的大小，而不是JVM堆内存的大小。

有人说，JDK 8以后采用了元空间来替代方法区，这种说法是完全错误的。

因为方法区是抽象概念，元空间是实现方式。

在JDK 8之前，类的元信息、常量池、静态变量等都存储在永久代这种具体实现中，而在JDK 8及以后，常量池、静态变量等被移除方法区，从而转移到了堆中，元信息这些依然保留在方法区内，但是具体的存储方式改成了元空间。

元信息包括：

类信息：包括类的名称、访问修饰符、继承关系、接口实现等。
字段信息：包括字段的名称、类型、访问修饰符等。
方法信息：包括方法的名称、返回类型、参数列表、异常表、访问修饰符等。
字节码指令：JVM执行的指令序列，用于实现类中定义的方法的具体行为。
类加载器信息：标识用于加载类的类加载器。

4. 解析

解析阶段是在准备阶段完成之后，主要做的一件事情就是将符号引用替换为直接引用。

注：事实上，解析阶段还有许多其他任务，例如：

类和接口的解析、自读但解析、类方法解析、实例方法解析，延迟解析（将某些引用推迟到运行时再进行解析）。

回到刚刚说的将符号引用替换为直接引用。

那么什么是符号引用，什么是直接引用呢？

我们首先假设类A与类B

符号引用（Symbolic Reference）

符号引用是编译时使用的一种引用形式，它通过一系列描述性的符号来引用目标。在Java类编译成.class文件后，如果类A中引用了类B，此时A中的引用会以符号引用的形式存在。这个符号引用通常是一个字符串，它代表了B的全限定名，如"com.example.B"。

直接引用（Direct Reference）

直接引用是类加载过程中解析阶段的一个输出，它是一个具体的指针，指向目标对象或目标类的内存地址。一旦类B被加载和链接到JVM中，JVM就会将类A中的符号引用替换为直接引用，这个直接引用指向类B的java.lang.Class对象或方法的具体内存地址。

当类A在运行时需要引用类B时，JVM会通过以下步骤来解析这个引用：

类加载：如果类B尚未被加载，JVM将触发类B的加载过程。
解析：JVM解析类A中的符号引用，找到类B的Class对象。
替换：JVM将符号引用替换为直接引用，这个直接引用指向类B的确切位置。

我在这篇博客中提到过动态链接的概念：

【JVM】从i++到JVM栈帧-CSDN博客

动态链接

每一个栈帧内部都包含一个指向运行时常量池中该栈帧所属方法的引用。包含这个引用的目的就是为了支持当前方法的代码能够实现动态链接。

在Java源文件被编译到字节码文件中时，所有的变量和方法引用都作为**符号引用（Symbolic Reference）**保存在class文件的常量池里。

比如：描述一个方法调用了另外的其他方法时，就是通过常量池中指向方法的符号引用来表示的，那么动态链接的作用就是为了将这些符号引用转换为调用方法的直接引用。

为什么这里也有将符号引用转换为直接引用的操作呢？这里的操作与类加载中的操作有什么区别？