当我们在编写 Java 应用程序时,我们通常会创建许多类。然而,这些类不是在应用程序启动时一次性全部加载的。相反,Java 运行时系统使用类加载器在运行时动态地加载类。这就是 Java 的类加载机制。在本篇博客中,我们将深入探讨 Java 的类加载机制,包括类加载器的层次结构、类加载的过程以及类加载的一些高级特性。
类加载过程
Java 类加载过程可以分为以下三个步骤:
-
加载(Loading):加载是类加载过程的第一个阶段,它的主要任务是查找并加载类的二进制数据。在这个阶段,Java 虚拟机需要完成以下三件事情:
- 通过类的全限定名获取类的二进制数据流。
- 将这个二进制数据流转换成方法区中的运行时数据结构。
- 在内存中生成一个代表这个类的 java.lang.Class 对象,作为方法区这个类的各种数据的入口。
-
链接(Linking):链接是类加载过程的第二个阶段,它的主要任务是将类的二进制数据合并到 Java 虚拟机的运行时状态中。链接阶段又分为以下三个小阶段:
- 校验(Verification):验证阶段主要是对类的二进制数据进行各种验证,以确保这些数据符合 Java 虚拟机规范和安全要求。验证阶段包括文件格式验证、元数据验证、字节码验证和符号引用验证等。
- 准备(Preparation):准备阶段是为类的静态变量分配内存并设置默认值(不是初始值)的阶段。这些变量在类加载过程中被分配在方法区中,而不是堆中。
- 解析(Resolution):解析阶段是将符号引用替换为直接引用的过程。符号引用是一种用来表示引用目标的符号,比如类和接口的全限定名、字段的名称和描述符、方法的名称和描述符等。而直接引用是一个指向目标的指针、偏移量或者是一个能够直接定位到目标的句柄。
-
初始化(Initialization):初始化是类加载过程的第三个阶段,它的主要任务是执行类的初始化代码。在 Java 中,类初始化代码包括静态变量的赋值(初始值)和静态代码块中的代码。类初始化是 Java 程序中类的主动使用的第一个时刻。当 Java 程序创建一个类的实例、访问类的静态变量或者调用类的静态方法时,Java 虚拟机会先执行类的初始化代码。
类加载器
JVM本身有一个类加载器(ClassLoader)的层次分别来加载不同的class。JVM中所有的class都是被类加载器加载到内存的。
当任何一个class被加载到内存之后,实际上它在内存中生成了两块内容,第一块是它本身的二进制码被原封不动的加载到内存,第二个是它生成了一个Class对象,之后我们生成的对象都是通过访问这个Class对象再去访问class内存文件。
类加载器的层次
类加载器是分成不同的层次的,不同的类加载器负责加载不同的class(注意:并不是父类继承的关系)
最顶层的类加载器是Boostrap,负责加载JDK里面最核心的jar之中的内容,是由C++实现的类加载器,如果我们使用getClassLoader方法获得的值为null,就代表我们已经到达了这个最顶层的类加载器。
Extension是扩展类加载器,用来加载 Java 运行时环境扩展目录(jre/lib/ext)中的类。扩展类加载器是由纯 Java 语言实现的。
Application是应用程序类加载器用来加载应用程序类路径(Classpath)中的类。
Custom ClassLoader 是自定义加载器。开发人员可以通过继承 java.lang.ClassLoader 类来实现自己的类加载器。自定义类加载器通常用于加载一些特殊的类,比如从网络或者数据库中加载类,或者实现一些特殊的类加载策略等。
类加载的过程:双亲委派
双亲委派是一种类加载机制,它是 Java 语言对类加载的一个重要约定。根据这个约定,类加载器在加载类时,首先将这个任务委派给它的父类加载器去完成,只有在父类加载器无法完成这个任务时,才会尝试自己去加载这个类。
双亲委派模型的工作流程如下:
-
当一个类加载器需要加载一个类时,它首先会将这个任务委派给它的父类加载器。
-
如果父类加载器能够找到并加载这个类,那么这个任务就完成了。
-
如果父类加载器无法找到这个类,那么这个任务就会被委派给父类加载器的父类加载器去完成,依次类推,直到任务被委派给 Bootstrap Class Loader(启动类加载器)为止。
-
如果 Bootstrap Class Loader 无法找到这个类,那么这个任务就会被回头向下委派
这种双亲委派机制可以保证 Java 类的唯一性,避免多个类加载器加载同一个类的情况。例如,如果有两个类加载器 A 和 B,它们都要加载一个名为 com.example.Test 的类,那么根据双亲委派模型,这个任务会被委派给 A 的父类加载器,如果 A 的父类加载器也无法完成这个任务,那么这个任务就会被委派给 B 的父类加载器,而不是由 A 和 B 各自加载一份 com.example.Test 类。这样可以保证 Java 类的唯一性,避免出现类重复加载的问题。
为什么要搞双亲委派
这种机制的好处是可以保证Java核心API的安全性和稳定性。由于Java核心API是由启动类加载器加载的,而启动类加载器是由JVM实现的,因此它的代码是受到信任的,是不会被破坏的。而其他类的加载则是由普通的类加载器完成的,这些类可能存在一些安全风险或者不稳定性,但由于它们的加载都是经过了双亲委派机制的,因此可以保证它们不会覆盖Java核心API的类。
双亲委派机制可以打破吗
可以,虽然双亲委派机制是 Java 类加载的一个重要约定,但是它并不是一种强制性机制,可以被打破。
一种打破双亲委派机制的方式是通过自定义类加载器来实现。自定义类加载器可以覆盖 findClass() 方法,实现自己的类加载逻辑,从而打破双亲委派机制。例如,当一个类加载器需要加载一个类时,它可以先尝试调用父类加载器的 findClass() 方法,如果父类加载器无法加载这个类,那么自定义类加载器就可以尝试自己去加载这个类。
另外,还可以通过线程上下文类加载器(Thread Context Class Loader)来打破双亲委派机制。线程上下文类加载器是每个线程独有的一个类加载器,它可以通过 Thread 类的 setContextClassLoader() 方法来设置。当一个类需要加载其他类时,它会使用当前线程的上下文类加载器来加载这些类,而不是使用双亲委派机制。这种方式可以在某些特殊情况下打破双亲委派机制,比如在应用程序中使用第三方库时,第三方库可能需要加载一些应用程序中不存在的类,这时可以使用线程上下文类加载器来加载这些类,避免出现类找不到的情况。
自定义类加载器
除了启动类加载器、扩展类加载器和应用程序类加载器之外,Java 类加载器还支持自定义类加载器,也就是说,开发人员可以通过继承 java.lang.ClassLoader 类来实现自己的类加载器。自定义类加载器通常用于加载一些特殊的类,比如从网络或者数据库中加载类,或者实现一些特殊的类加载策略等。