JVM: Java类加载机制
Java类加载机制是JVM将Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可被JVM直接使用的Java类型的全过程。其核心分为加载、连接(验证→准备→解析)、初始化三大阶段(卸载是类生命周期的结束阶段,通常由GC完成),以下是各阶段的详细说明:
一、加载(Loading)
加载是类加载的首个阶段,JVM需完成三件事:
- 获取二进制字节流:通过类的全限定名(如
java.lang.String
),从文件(.class)、网络、动态代理等途径获取类的二进制字节流。 - 转换为方法区运行时数据结构:将字节流中的静态存储结构(如常量池、字段、方法等)转换为方法区的动态运行时数据结构。
- 生成Class对象:在堆内存中创建一个
java.lang.Class
对象,作为方法区中类数据的访问入口(反射机制即基于此对象)。
二、连接(Linking)
连接阶段是将加载后的类数据整合到JVM运行时环境的过程,包含验证、准备、解析三个子阶段。
2.1 验证(Verification)
验证是连接的第一步,确保Class文件的字节流符合JVM规范,避免安全隐患。分为四部分:
- 文件格式验证:检查字节流是否符合Class文件格式(如魔数是否为
0xCAFEBABE
、版本号是否兼容当前JVM)。 - 元数据验证:对类的语义进行分析(如是否有父类、父类是否继承非法类、抽象方法是否有实现)。
- 字节码验证:最复杂的阶段,通过分析字节码指令,确保程序逻辑合法(如操作数栈类型匹配、跳转指令有效)。
- 符号引用验证:验证类依赖的外部资源(如引用的类、方法、字段)是否存在且可访问(如符号引用的全限定名能否找到对应类)。
2.2 准备(Preparation)
准备阶段为类的**静态变量(类变量)**分配内存,并设置初始“零值”(如int
初始为0,boolean
初始为false
)。注意:
- 内存分配在方法区(JDK8前为永久代,JDK8后为元空间)。
- 初始值是“零值”,而非代码中显式赋值(如
public static int a = 333
,准备阶段a
为0,显式赋值在初始化阶段完成)。 - **静态常量(
static final
)**直接在编译期确定值,准备阶段直接赋实际值(如public static final int a = 3
,准备阶段a
即为3)。
2.3 解析(Resolution)
解析阶段将常量池中的符号引用转换为直接引用:
- 符号引用:用字符串描述的逻辑引用(如
java.lang.Object
),与内存布局无关。 - 直接引用:指向目标的内存指针或偏移量(如方法的具体内存地址),与JVM内存布局强相关。
解析可发生在初始化前后(支持动态绑定,如多态),常见解析目标包括类、接口、字段、方法等。
三、初始化(Initialization)
初始化是类加载的最后一步,JVM执行类构造器clinit()
方法,完成类变量的显式赋值和静态代码块的执行。
clinit()
方法的特点
- 由编译器自动生成,收集类中所有静态变量赋值语句和静态代码块(按代码顺序合并)。
- 父类的
clinit()
优先于子类执行(确保父类先初始化)。 - 接口的
clinit()
在其实现类初始化前执行(JDK8起,接口支持default
方法时需提前初始化)。
触发初始化的场景(主动使用)
- 创建类的实例(
new Object()
)。 - 访问类的静态变量(非
final
常量)或调用静态方法。 - 通过反射调用类(如
Class.forName("com.example.Demo")
)。 - 虚拟机启动时的主类(含
main
方法的类)。 - 动态语言支持中,解析到
REF_getStatic
等类型的方法句柄且类未初始化。
不触发初始化的场景(被动使用)
- 子类调用父类的静态变量(仅父类初始化)。
- 定义类的数组(如
User[] users = new User[10]
,仅初始化数组类,非User
类)。 - 引用类的
static final
常量(常量在编译期已存入调用类的常量池)。
四、卸载(Unloading)
类的卸载由GC完成,需满足以下条件:
- 该类的所有实例已被回收(堆中无
Class
对象)。 - 加载该类的类加载器已被回收。
- 该类的
clinit()
方法已执行完毕且无其他引用。
总结:类加载机制通过“加载→连接(验证、准备、解析)→初始化”的顺序完成类的激活,其中验证保障安全,准备分配资源,解析建立内存关联,初始化执行用户代码。理解这一过程对分析类初始化顺序、动态代理、反射等场景有重要意义。
类初始化的六种主动引用场景
《Java虚拟机规范》严格规定,有且只有以下六种情况必须立即对类进行初始化(加载、验证、准备自然在此之前开始):
- 字节码指令触发:
- 使用
new
关键字实例化对象、读取/设置非final
静态字段、调用静态方法(对应new
、getstatic
、putstatic
、invokestatic
指令)。 - 示例:
new Object()
、Class.value
(非final
静态字段)、Class.staticMethod()
。
- 使用
- 反射调用:通过
java.lang.reflect
包反射调用类的方法或字段,若类未初始化则触发。 - 父类初始化:初始化子类时,若父类未初始化,先触发父类初始化。
- 虚拟机启动:指定的主类(含
main()
方法的类)需先初始化。 - 动态语言支持:
MethodHandle
解析为REF_getStatic
等类型,且对应类未初始化。 - 接口默认方法:JDK 8+中,接口的实现类初始化时,若接口有
default
方法,先初始化接口。
被动引用示例
以下场景不会触发类初始化(被动引用):
示例1:通过子类引用父类静态字段
// 父类
public class SuperClass {
static { System.out.println("SuperClass init!"); }
public static int value = 123;
}
// 子类(无主动引用)
public class SubClass extends SuperClass {
static { System.out.println("SubClass init!"); }
}
// 测试类
public class NotInitialization {
public static void main(String[] args) {
System.out.println(SubClass.value); // 输出:SuperClass init! 123(仅父类初始化)
}
}
结论:静态字段属于定义它的类(父类),子类引用不会触发子类初始化。
示例2:通过数组定义引用类
public class NotInitialization {
public static void main(String[] args) {
SuperClass[] sca = new SuperClass[10]; // 仅创建数组类,不触发SuperClass初始化
}
}
结论:数组类由虚拟机动态生成,不触发元素类型(SuperClass
)的初始化