虚拟机夯实基础系列-虚拟机类加载机制深入浅出

想转码的土木狗

已于 2023-08-29 14:43:40 修改

阅读量111

点赞数

文章标签： python 开发语言

于 2023-08-29 14:42:17 首次发布

本文链接：https://blog.csdn.net/Lms07121/article/details/132560156

版权

1.1 概述

本篇文章虚拟机如何加载这些 Class 文件，Class 文件中的信息进入到虚拟机后会发生什么变化。

Java 虚拟机把描述类的数据从 Class 文件加载到内存，并对数据进行校验、转换解析和初
始化，最终形成可以被虚拟机直接使用的 Java 类型，这个过程被称作虚拟机的类加载机制。
在 Java 语言里面，类型的加载、连接和初始化过程都是在程序运行期间完成的，这种策
略让 Java 语言进行提前编译会面临额外的困难，也会让类加载时稍微增加一些性能开销，
但是却为 Java 应用提供了极高的扩展性和灵活性，Java 天生可以动态扩展的语言特性就是
依赖运行期动态加载和动态连接这个特点实现的。例如，编写一个面向接口的应用程序，
可以等到运行时再指定其实际的实现类，用户可以通过 Java 预置的或自定义类加载器，让
某个本地的应用程序在运行时从网络或其他地方上加载一个二进制流作为其程序代码的一
部分。

1.2 类加载的时机

一个类型从被加载到虚拟机内存中开始，到卸载出内存为止，它的整个生命周期将会经历加
载（Loading）、验证（Verification）、准备（Preparation）、解析（Resolution）、
初始化（Initialization）、使用（Using）和卸载（Unloading）七个阶段，其中验证、
准备、解析三个部分统称为连接（Linking）。这七个阶段的发生顺序如下图所示。
在这里插入图片描述
加载、验证、准备、初始化和卸载这五个阶段的顺序是确定的，类型的加载过程必须按照这
种顺序按部就班地开始，而解析阶段则不一定：它在某些情况下可以在初始化阶段之后再
开始，这是为了支持 Java 语言的运行时绑定特性（也称为动态绑定或晚期绑定）。
对于初始化阶段，《Java 虚拟机规范》则是严格规定了有且只有六种情况必须立即对类进
行“初始化”（而加载、验证、准备自然需要在此之前开始）：

遇到 new、getstatic、putstatic 或 invokestatic 这四条字节码指令时，如果类型没
有进行过初始化，则需要先触发其初始化阶段。能够生成这四条指令的典型 Java 代码场景
有：

使用new关键字实例化对象的时候。
读取或设置一个类型的静态字段（被 final 修饰、已在编译期把结果放入常量池的静
态字段除外）的时候。
·调用一个类型的静态方法的时候。

使用 java.lang.reflect 包的方法对类型进行反射调用的时候，如果类型没有进行过初
始化，则需要先触发其初始化。
当初始化类的时候，如果发现其父类还没有进行过初始化，则需要先触发其父类的初始
化。
当虚拟机启动时，用户需要指定一个要执行的主类（包含 main()方法的那个类），虚
拟机会先初始化这个主类。
当使用 JDK 7 新加入的动态语言支持时，如果一个 ava.lang.invoke.MethodHandle 实
例最后的解析结果为 REF_getStatic、REF_putStatic、REF_invokeStatic、REF_newInvok
eSpecial 四种类型的方法句柄，并且这个方法句柄对应的类没有进行过初始化，则需要先
触发其初始化。
当一个接口中定义了 JDK 8 新加入的默认方法（被 default 关键字修饰的接口方法）时，
如果有这个接口的实现类发生了初始化，那该接口要在其之前被初始化。

对于这六种会触发类型进行初始化的场景，《Java 虚拟机规范》中使用了一个非常强烈的
限定语 ——“有且只有”，这六种场景中的行为称为对一个类型进行主动引用。除此之外，
所有引用类型的方式都不会触发初始化，称为被动引用。

接口与类真正有所区别的是前面讲述的六种“有且仅有”需要触发初始化场景中的第三种：
当一个类在初始化时，要求其父类全部都已经初始化过了，但是一个接口在初始化时，并不
要求其父接口全部都完成了初始化，只有在真正使用到父接口的时候（如引用接口中定义
的常量）才会初始化。

1.3 类加载的过程

1.3.1 加载

“加载”（Loading）阶段是整个“类加载”（Class Loading）过程中的一个阶段。在加载
阶段，Java 虚拟机需要完成以下三件事情：

通过一个类的全限定名来获取定义此类的二进制字节流。
将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
在内存中生成一个代表这个类的 java.lang.Class 对象，作为方法区这个类的各种数据
的访问入口。

相对于类加载过程的其他阶段，非数组类型的加载阶段（准确地说，是加载阶段中获取类的
二进制字节流的动作）是开发人员可控性最强的阶段。加载阶段既可以使用 Java 虚拟机里
内置的引导类加载器来完成，也可以由用户自定义的类加载器去完成，开发人员通过定义
自己的类加载器去控制字节流的获取方式（重写一个类加载器的 findClass()或 loadClass()
方法），实现根据自己的想法来赋予应用程序获取运行代码的动态性。

对于数组类而言，情况就有所不同，数组类本身不通过类加载器创建，它是由 Java 虚拟机
直接在内存中动态构造出来的。但数组类与类加载器仍然有很密切的关系，因为数组类的
元素类型（Element Type，指的是数组去掉所有维度的类型）最终还是要靠类加载器来完
成加载，一个数组类（下面简称为 C）创建过程遵循以下规则：

如果数组的组件类型（Component Type，指的是数组去掉一个维度的类型，注意和前面的
元素类型区分开来）是引用类型，那就递归采用本节中定义的加载过程去加载这个组件类型，
数组 C 将被标识在加载该组件类型的类加载器的类名称空间上（这点很重要，在 7.4 节会介
绍，一个类型必须与类加载器一起确定唯一性）。
如果数组的组件类型不是引用类型（例如 int[]数组的组件类型为 int），Java 虚拟机将
会把数组 C 标记为与引导类加载器关联。
数组类的可访问性与它的组件类型的可访问性一致，如果组件类型不是引用类型，它的数
组类的可访问性将默认为 public，可被所有的类和接口访问到。
加载阶段结束后，Java 虚拟机外部的二进制字节流就按照虚拟机所设定的格式存储在方法
区之中了，方法区中的数据存储格式完全由虚拟机实现自行定义，《Java 虚拟机规范》未
规定此区域具体数据结构。类型数据妥善安置在方法区之后，会在 Java 堆内存中实例化一
个 java.lang.Class 类的对象，这个对象将作为程序访问方法区中的类型数据的外部接口。
加载阶段与连接阶段的部分动作（如一部分字节码文件格式验证动作）是交叉进行的，加
载阶段尚未完成，连接阶段可能已经开始，但这些夹在加载阶段之中进行的动作，仍然属于
连接阶段的一部分，这两个阶段的开始时间仍然保持着固定的先后顺序。

1.3.2 验证

验证是连接阶段的第一步，这一阶段的目的是确保 Class 文件的字节流中包含的信息符合
《Java 虚拟机规范》的全部约束要求，保证这些信息被当作代码运行后不会危害虚拟机自
身的安全。

Class 文件并不一定只能由 Java 源码编译而来，它可以使用包括靠键盘 0 和 1 直接在二进
制编辑器中敲出 Class 文件在内的任何途径产生。Java 代码无法做到的事情在字节码层面
上都是可以实现的，至少语义上是可以表达出来的。

验证阶段是非常重要的，这个阶段是否严谨，直接决定了 Java 虚拟机是否能承受恶意代码
的攻击，从代码量和耗费的执行性能的角度上讲，验证阶段的工作量在虚拟机的类加载过
程中占了相当大的比重。验证阶段大致上会完成下面四个阶段的检验动作：文件格式验证、
元数据验证、字节码验证和符号引用验证。

文件格式验证

第一阶段要验证字节流是否符合 Class 文件格式的规范，并且能被当前版本的虚拟机处理。
这一阶段可能包括下面这些验证点：

是否以魔数 0xCAFEBABE 开头。
主、次版本号是否在当前 Java 虚拟机接受范围之内。
常量池的常量中是否有不被支持的常量类型（检查常量 tag 标志）。
指向常量的各种索引值中是否有指向不存在的常量或不符合类型的常量。
CONSTANT_Utf8_info 型的常量中是否有不符合 UTF-8 编码的数据。
Class 文件中各个部分及文件本身是否有被删除的或附加的其他信息。
……

该验证阶段的主要目的是保证输入的字节流能正确地解析并存储于方法区之内，格式上符合
描述一个 Java 类型信息的要求。这阶段的验证是基于二进制字节流进行的，只有通过了这
个阶段的验证之后，这段字节流才被允许进入 Java 虚拟机内存的方法区中进行存储，所以
后面的三个验证阶段是基于方法区的存储结构上进行的，不会再直接读取、操作字节流了。

元数据验证

第二阶段是对字节码描述的信息进行语义分析，以保证其描述的信息符合《Java 语言规范》
的要求，这个阶段可能包括的验证点如下：

这个类是否有父类（除了 java.lang.Object 之外，所有的类都应当有父类）。
这个类的父类是否继承了不允许被继承的类（被 final 修饰的类）。
如果这个类不是抽象类，是否实现了其父类或接口之中要求实现的所有方法。
类中的字段、方法是否与父类产生矛盾（例如覆盖了父类的 final 字段，或者出现不符
合规则的方法重载，例如方法参数都一致，但返回值类型却不同等）。
……

第二阶段的主要目的是对类的元数据信息进行语义校验，保证不存在与《Java 语言规范》
定义相悖的元数据信息。

字节码验证

第三阶段是整个验证过程中最复杂的一个阶段，主要目的是通过数据流分析和控制流分析，
确定程序语义是合法的、符合逻辑的。在第二阶段对元数据信息中的数据类型校验完毕以
后，这阶段就要对类的方法体（Class 文件中的 Code 属性）进行校验分析，保证被校验类
的方法在运行时不会做出危害虚拟机安全的行为，例如：

保证任意时刻操作数栈的数据类型与指令代码序列都能配合工作，例如不会出现类似于
“在操作栈放置了一个 int 类型的数据，使用时却按 long 类型来加载入本地变量表中”这
样的情况。
保证任何跳转指令都不会跳转到方法体以外的字节码指令上。
保证方法体中的类型转换总是有效的，例如可以把一个子类对象赋值给父类数据类型，
这是安全的，但是把父类对象赋值给子类数据类型，甚至把对象赋值给与它毫无继承关系、
完全不相干的一个数据类型，则是危险和不合法的。
……

如果一个类型中有方法体的字节码没有通过字节码验证，那它肯定是有问题的；但如果一个
方法体通过了字节码验证，也仍然不能保证它一定就是安全的。因为通过程序去校验程序逻
辑是无法做到绝对准确的，不可能用程序来准确判定一段程序是否存在 Bug。

符号引用验证

最后一个阶段的校验行为发生在虚拟机将符号引用转化为直接引用的时候，这个转化动作将
在连接的第三阶段——解析阶段中发生。检验该类是否缺少或者被禁止访问它依赖的某些外
部类、方法、字段等资源。本阶段通常需要校验下列内容：

符号引用中通过字符串描述的全限定名是否能找到对应的类。
在指定类中是否存在符合方法的字段描述符及简单名称所描述的方法和字段。
符号引用中的类、字段、方法的可访问性（private、protected、public、）
是否可被当前类访问。
……

符号引用验证的主要目的是确保解析行为能正常执行，如果无法通过符号引用验证，Java
虚拟机将会抛出一个 java.lang.IncompatibleClassChangeError 的子类异常，典型的如：
java.lang.IllegalAccessError、java.lang.NoSuchFieldError、java.lang.NoSuchMetho
dError 等。

验证阶段对于虚拟机的类加载机制来说，是一个非常重要的、但却不是必须要执行的阶段，
因为验证阶段只有通过或者不通过的差别，只要通过了验证，其后就对程序运行期没有任
何影响了。如果程序运行的全部代码（包括自己编写的、第三方包中的、从外部加载的、动
态生成的等所有代码）都已经被反复使用和验证过，在生产环境的实施阶段就可以考虑使用
-Xverify：none 参数来关闭大部分的类验证措施，以缩短虚拟机类加载的时间。

1.3.3 准备

准备阶段是正式为类中定义的变量（即静态变量，被 static 修饰的变量）分配内存并设置
类变量初始值的阶段，从概念上讲，这些变量所使用的内存都应当在方法区中进行分配，但
必须注意到方法区本身是一个逻辑上的区域，在 JDK 7 及之前，HotSpot 使用永久代来实现
方法区时，实现是完全符合这种逻辑概念的；而在 JDK 8 及之后，类变量则会随着 Class
对象一起存放在元空间中，这时候“类变量在方法区”就完全是一种对逻辑概念的表述了。
拓展：JDK8 以后的虚拟机内存图解
在这里插入图片描述
假设一个类变量的定义为：

                                     public static int value = 123;

变量 value 在准备阶段过后的初始值为 0 而不是 123，因为这时尚未开始执行任何 Java 方
法，而把 value 赋值为 123 的 putstatic 指令是程序被编译后，存放于类构造器()
方法之中，所以把 value 赋值为 123 的动作要到类的初始化阶段才会被执行。“通常情况”
下初始值是零值，还会有某些“特殊情况”：如果类字段的字段属性表中存在 ConstantVal
ue 属性，那在准备阶段变量值就会被初始化为 ConstantValue 属性所指定的初始值，假设
上面类变量 value 的定义修改为：

                                 public static final int value = 123;

编译时 Javac 将会为 value 生成 ConstantValue 属性，在准备阶段虚拟机就会根据 Con-sta
ntValue 的设置将 value 赋值为 123。

1.3.4 解析

解析阶段是 Java 虚拟机将常量池内的符号引用替换为直接引用的过程，在 Class 文件中它
以 CONSTANT_Class_info、CONSTANT_Fieldref_info、CONSTANT_Methodref_info 等类型的
常量出现，直接引用与符号引用的关联：

符号引用（Symbolic References）：符号引用以一组符号来描述所引用的目标，符号可
以是任何形式的字面量，只要使用时能无歧义地定位到目标即可。符号引用与虚拟机实现的
内存布局无关，引用的目标并不一定是已经加载到虚拟机内存当中的内容。各种虚拟机实现
的内存布局可以各不相同，但是它们能接受的符号引用必须都是一致的，因为符号引用的
字面量形式明确定义在《Java 虚拟机规范》的 Class 文件格式中。
直接引用（Direct References）：直接引用是可以直接指向目标的指针、相对偏移量或
者是一个能间接定位到目标的句柄。直接引用是和虚拟机实现的内存布局直接相关的，同一
个符号引用在不同虚拟机实例上翻译出来的直接引用一般不会相同。如果有了直接引用，那
引用的目标必定已经在虚拟机的内存中存在。

《Java 虚拟机规范》要求在执行 anewarray、checkcast、getfield、getstatic、instanceof、
invokedynamic、invokeinterface、 invoke-special、invokestatic、invokevirtual、
ldc、ldc_w、ldc2_w、multianewarray、new、putfield 和 putstatic 这 17 个用于操作符
号引用的字节码指令之前，先对它们所使用的符号引用进行解析。所以虚拟机实现可以根据
需要来自行判断，到底是在类被加载器加载时就对常量池中的符号引用进行解析，还是等到
一个符号引用将要被使用前才去解析它。

对同一个符号引用进行多次解析请求是很常见的事情，除 invokedynamic 指令以外，虚拟机
实现可以对第一次解析的结果进行缓存，譬如在运行时直接引用常量池中的记录，并把常量
标识为已解析状态，从而避免解析动作重复进行。

不过对于 invokedynamic 指令，上面的规则就不成立了。当碰到某个前面已经由
invokedynamic 指令触发过解析的符号引用时，并不意味着这个解析结果对于其他
invokedynamic 指令也同样生效。因为 invokedynamic 指令的目的本来就是用于动态语言支
持，它对应的引用称为“动态调用点限定符（Dynamically-Computed Call Site
Specifier）”，这里“动态”的含义是指必须等到程序实际运行到这条指令时，解析动作
才能进行。相对地，其余可触发解析的指令都是“静态”的，可以在刚刚完成加载阶段，还
没有开始执行代码时就提前进行解析。

解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限
定符这 7 类符号引用进行。

1.3.5 初始化

直到初始化阶段，Java 虚拟机才真正开始执行类中编写的 Java 程序代码，将主导权移交给
应用程序。

进行准备阶段时，变量已经赋过一次系统要求的初始零值，而在初始化阶段，则会根据程序
员通过程序编码制定的主观计划去初始化类变量和其他资源。我们也可以从另外一种更直
接的形式来表达：初始化阶段就是执行类构造器<clinit>()方法的过程。 <clinit>()并不
是程序员在 Java 代码中直接编写的方法，它是 Javac 编译器的自动生成物。

虚拟机首先执行类加载初始化过程中的<clinit>()方法，也就是静态变量赋值以及静态代码
块中的代码，如果<clinit>()方法中触发了对象的初始化，也就是<init>()方法，那么会
进入执行<init>()方法，执行<init>()方法完成之后，再回来继续执行<clinit>()方法。
·<clinit>()方法是由编译器自动收集类中的所有类变量的赋值动作和静态语句块
（static{}块）中的语句合并产生的，编译器收集的顺序是由语句在源文件中出现的顺序
决定的，静态语句块中只能访问到定义在静态语句块之前的变量，定义在它之后的变量，在
前面的静态语句块可以赋值，但是不能访问。

<>()方法与类的构造函数（即在虚拟机视角中的实例构造器<init>()方法）不同，
它不需要显式地调用父类构造器，Java 虚拟机会保证在子类的<clinit>()方法执行前，父
类的<clinit>()方法已经执行完毕。因此在 Java 虚拟机中第一个被执行的<clinit>()方法
的类型肯定是 java.lang.Object。
由于父类的<clinit>()方法先执行，也就意味着父类中定义的静态语句块要优先于子类
的变量赋值操作。
<clinit>()方法对于类或接口来说并不是必需的，如果一个类中没有静态语句块，也没
有对变量的赋值操作，那么编译器可以不为这个类生成<clinit>()方法。
接口中不能使用静态语句块，但仍然有变量初始化的赋值操作，因此接口与类一样都会生
成<clinit>()方法。但接口与类不同的是，执行接口的<clinit>()方法不需要先执行父接
口的<clinit>()方法，因为只有当父接口中定义的变量被使用时，父接口才会被初始化。此
外，接口的实现类在初始化时也一样不会执行接口的<clinit>()方法。
JVM 必须保证一个类的<clinit>()方法在多线程环境中被正确地加锁同步，如果多个线程
同时去初始化一个类，那么只会有其中一个线程去执行这个类的<clinit>()方法，其他线程
都需要阻塞等待，直到活动线程执行完毕<clinit>()方法。如果在一个类的<clinit>()方
法中有耗时很长的操作，那就可能造成多个进程阻塞(其他线程虽然会被阻塞，但如果执行
<clinit>()方法的那条线程退出<clinit>()方法后，其他线程唤醒后则不会再次进入
<clinit>()方法。同一个类加载器下，一个类型只会被初始化一次。)。

初始化顺序依次是：(静态变量、静态初始化块)、(变量、初始化块)、构造器；如果有父
类，则顺序是：父类 static 方法、子类 static 方法、父类构造方法、子类构造方法。

1.4 类加载器

Java 虚拟机设计团队有意把类加载阶段中的“通过一个类的全限定名(就是类名全称，带包
路径的用点隔开，例如: java.lang.String。)来获取描述该类的二进制字节流”这个动作
放到 Java 虚拟机外部去实现，以便让应用程序自己决定如何去获取所需的类。实现这个动
作的代码被称为“类加载器”（Class Loader）。

1.4.1 类与类加载器

对于任意一个类，都必须由加载它的类加载器和这个类本身一起共同确立其在 Java 虚拟机
中的唯一性。每一个类加载器，都拥有一个独立的类名称空间。比较两个类是否“相等”，
只有在这两个类是由同一个类加载器加载的前提下才有意义，否则，即使这两个类来源于同
一个 Class 文件，被同一个 Java 虚拟机加载，只要加载它们的类加载器不同，那这两个类
就必定不相等。

1.4.2 双亲委派模型

站在 Java 虚拟机的角度来看，只存在两种不同的类加载器：一种是启动类加载器（Bootstrap
ClassLoader），这个类加载器使用 C++语言实现，是虚拟机自身的一部分；另外一种就是
其他所有的类加载器，这些类加载器都由 Java 语言实现，独立存在于虚拟机外部，并且全
都继承自抽象类 java.lang.ClassLoader。

自 JDK 1.2 以来，Java 一直保持着三层类加载器、双亲委派的类加载架构。绝大多数 Java
程序都会使用到以下 3 个系统提供的类加载器来进行加载。

启动类加载器（Bootstrap Class Loader）：前面已经介绍过，这个类加载器负责加载
存放在\lib 目录，或者被-Xbootclasspath 参数所指定的路径中存放的，而且 Java 虚拟机
能够识别（按照文件名识别，如 rt.jar、tools.jar，名字不符合的类库即使放在 lib 目录
中也不会被加载）类库加载到虚拟机的内存中。启动类加载器无法被 Java 程序直接引用，
用户在编写自定义类加载器时，如果需要把加载请求委派给引导类加载器去处理，那直接使
用 null 代替即可。
扩展类加载器（Extension Class Loader）：这个类加载器是在类 sun.misc.Launcher$E
xtClassLoader 中以 Java 代码的形式实现的。它负责加载\lib\ext 目录中，或者被 java.
ext.dirs 系统变量所指定的路径中所有的类库。根据“扩展类加载器”这个名称，就可以
推断出这是一种 Java 系统类库的扩展机制，JDK 的开发团队允许用户将具有通用性的类库
放置在 ext 目录里以扩展 Java SE 的功能，在 JDK 9 之后，这种扩展机制被模块化带来的天
然的扩展能力所取代。由于扩展类加载器是由 Java 代码实现的，开发者可以直接在程序中
使用扩展类加载器来加载 Class 文件。
应用程序类加载器（Application Class Loader）：这个类加载器由
sun.misc.Launcher$AppClassLoader 来实现。由于应用程序类加载器是 ClassLoader 类中
的 getSystem-ClassLoader()方法的返回值，所以有些场合中也称它为“系统类加载器”。
它负责加载用户类路径（ClassPath）上所有的类库，开发者同样可以直接在代码中使用这
个类加载器。如果应用程序中没有自定义过自己的类加载器，一般情况下这个就是程序中默
认的类加载器。

JDK 9 之前的 Java 应用都是由这三种类加载器互相配合来完成加载的，如果用户认为有必
要，还可以加入自定义的类加载器来进行拓展，典型的如增加除了磁盘位置之外的 Class
文件来源，或者通过类加载器实现类的隔离、重载等功能。这些类加载器之间的协作关系“通
常”会如下图所示。图中展示的各种类加载器之间的层次关系被称为类加载器的“双亲委派
模型（Parents Delegation Model）”。双亲委派模型要求除了顶层的启动类加载器外，
其余的类加载器都应有自己的父类加载器。不过这里类加载器之间的父子关系一般不是以继
承（Inheritance）的关系来实现的，而是通常使用组合（Composition）关系来复用父加
载器的代码。
在这里插入图片描述
双亲委派模型的工作过程是：如果一个类加载器收到了类加载的请求，它首先不会自己去尝
试加载这个类，而是把这个请求委派给父类加载器去完成，每一个层次的类加载器都是如
此，因此所有的加载请求最终都应该传送到最顶层的启动类加载器中，只有当父加载器反
馈自己无法完成这个加载请求（它的搜索范围中没有找到所需的类）时，子加载器才会尝
试自己去完成加载。

双亲委派模型的代码全部集中在 java.lang.ClassLoader 的 loadClass()方法之中，如代码
清单所示。

protected synchronized Class <?> (String name, boolean resolve) throws
ClassNotFoundException {
               // 首先，检查请求的类是否已经被加载过了
               Class c = findLoadedClass(name);
               if (c == null) {
                  try {
                       if (parent != null) {
                           c = parent.loadClass(name, false);
                       } else {
                            c = findBootstrapClassOrNull(name);
                       }
                   } catch (ClassNotFoundException e) {
                         // 如果父类加载器抛出 ClassNotFoundException
                         // 说明父类加载器无法完成加载请求
                   }
                   if (c == null) {
                       // 在父类加载器无法加载时
                       // 再调用本身的 findClass 方法来进行类加载
                       c = findClass(name);
                   }
                }
                if (resolve) {
                   resolveClass(c);
                }
                return c;
}

这段代码的逻辑清晰易懂：先检查请求加载的类型是否已经被加载过，若没有则调用父加载
器的 loadClass()方法，若父加载器为空则默认使用启动类加载器作为父加载器。假如父类
加载器加载失败，抛出 ClassNotFoundException 异常的话，才调用自己的 findClass()方
法尝试进行加载。

双亲委派模型是为了让基础类得以正确地统一地加载。如果你也定义了一个
java.lang.Object 类，通过双亲委派模式是会把这个请求委托给启动类加载器，它扫描\lib
目录就找到了 jdk 定义的 java.lang.Object 类来加载，所以压根不会加载你写的
java.lang.Object 类，这就可以避免一些程序不小心或者有意的覆盖基础类。

1.4.3 破坏双亲委派模型

双亲委派模型并不是一个具有强制性约束的模型，而是 Java 设计者推荐给开发者们的类加
载器实现方式。在 Java 的世界中大部分的类加载器都遵循这个模型，但也有例外的情况，
直到 Java 模块化出现为止，双亲委派模型主要出现过 3 次较大规模 “被破坏”的情况。
双亲委派模型的第一次“被破坏”发生在双亲委派模型出现之前——即JDK 1.2面世以前的
“远古”时代。在 jdk 1.2 之前，那时候还没有双亲委派模型，不过已经有了 ClassLoader
这个抽象类和类加载器的概念，所以已经有人继承这个抽象类，重写 loadClass 方法来实现
用户自定义类加载器。而在 1.2 的时候要引入双亲委派模型，为了向前兼容，loadClass 这
个方法还得保留着使之得以重写，新搞了个 findClass 方法让用户去重写，并呼吁大家不要
重写 loadClass 只要重写 findClass。双亲委派的具体逻辑就实现在 loadClass()里面，按
照 loadClass()方法的逻辑，如果父类加载失败，会自动调用自己的 findClass()方法来完
成加载，这样既不影响用户按照自己的意愿去加载类，又可以保证新写出来的类加载器是符
合双亲委派规则的。

双亲委派模型的第二次“被破坏”是由这个模型自身的缺陷导致的。双亲委派很好地解决了
各个类加载器协作时基础类型的一致性问题（越基础的类由越上层的加载器进行加载），
基础类型之所以被称为“基础”，是因为它们总是作为被用户代码继承、调用的 API 存在，
但程序设计往往没有绝对不变的完美规则，如果有基础类型又要调用回用户的代码，那该怎
么办呢？

JNDI 现在已经是 Java 的标准服务，它的代码由启动类加载器来完成加载。但 JNDI 存在的
目的就是对资源进行查找和集中管理，它需要调用由其他厂商实现并部署在应用程序的
ClassPath 下的 JNDI 的 SPI（首先得知道什么是 SPI(Service Provider Interface)，它是
面向拓展的，也就是说我定义了个规矩，就是 SPI ，具体如何实现由扩展者实现。）代码。
具体解决办法就是线程上下文类加载器（Thread Context ClassLoader）。这个类加载器
可以通过 java.lang.Thread 类的 setContext-ClassLoader()方法进行设置，如果创建线程
时还未设置，它将会从父线程中继承一个，如果在应用程序的全局范围内都没有设置过的话，
那这个类加载器默认就是应用程序类加载器。

JNDI 服务使用这个线程上下文类加载器去加载所需的 SPI 服务代码，这是一种父类加载器
去请求子类加载器完成类加载的行为，这种行为实际上是打通了双亲委派模型的层次结构来
逆向使用类加载器，已经违背了双亲委派模型的一般性原则，但也是无可奈何的事情。Java
中涉及 SPI 的加载基本上都采用这种方式来完成，例如 JNDI、JDBC、JCE、JAXB 和 JBI 等。
双亲委派模型的第三次“被破坏”是由于用户对程序动态性的追求而导致的，这里的动态性
指的是“热部署”，也就是所谓的“不停机更新”，不停机更新这对企业来说至关重要，毕
竟停机是大事。

OSGi 实现模块化热部署的关键是它自定义的类加载器机制的实现，每一个程序模块（OSGi
中称为 Bundle）都有一个自己的类加载器，当需要更换一个 Bundle 时，就把 Bundle 连同
类加载器一起换掉以实现代码的热替换。在 OSGi 环境下，类加载器不再双亲委派模型推荐
的树状结构，而是进一步发展为更加复杂的网状结构，当收到类加载请求时，OSGi 将按照
下面的顺序进行类搜索：

将以 java.*开头的类，委派给父类加载器加载。
否则，将委派列表名单内的类，委派给父类加载器加载。
否则，将 Import 列表中的类，委派给 Export 这个类的 Bundle 的类加载器加载。
否则，查找当前 Bundle 的 ClassPath，使用自己的类加载器加载。
否则，查找类是否在自己的 Fragment Bundle 中，如果在，则委派给 Fragment Bundle
的类加载器加载。
否则，查找 Dynamic Import 列表的 Bundle，委派给对应 Bundle 的类加载器加载。
否则，类查找失败。

上面的查找顺序中只有开头两点仍然符合双亲委派模型的原则，其余的类查找都是在平级
的类加载器中进行的。

1.5 Java 模块化系统

在 JDK 9 中引入的 Java 模块化系统（Java Platform Module System，JPMS）是对 Java 技
术的一次重要升级，为了能够实现模块化的关键目标——可配置的封装隔离机制，Java 虚
拟机对类加载架构也做出了相应的变动调整，才使模块化系统得以顺利地运作。JDK 9 的模
块不仅仅像之前的 JAR 包那样只是简单地充当代码的容器，除了代码外，Java 的模块定义
还包含以下内容：

依赖其他模块的列表。
导出的包列表，即其他模块可以使用的列表。
开放的包列表，即其他模块可反射访问模块的列表。
使用的服务列表。
提供服务的实现列表。

1.5.1 模块的兼容性

为了使可配置的封装隔离机制能够兼容传统的类路径查找机制，JDK 9 提出了与“类路径”
（ClassPath）相对应的“模块路径”（ModulePath）的概念。简单来说，就是某个类库到
底是模块还是传统的 JAR 包，只取决于它存放在哪种路径上。只要是放在类路径上的 JAR
文件，无论其中是否包含模块化信息（是否包含了 module-info.class 文件），它都会被
当作传统的 JAR 包来对待；相应地，只要放在模块路径上的 JAR 文件，即使没有使用 JMOD
后缀，甚至说其中并不包含 module-info.class 文件，它也仍然会被当作一个模块来对待。

JAR 文件在类路径的访问规则：所有类路径下的 JAR 文件及其他资源文件，都被视为自动
打包在一个匿名模块（Unnamed Module）里，这个匿名模块几乎是没有任何隔离的，它可
以看到和使用类路径上所有的包、JDK 系统模块中所有的导出包，以及模块路径上所有模块
中导出的包。
模块在模块路径的访问规则：模块路径下的具名模块（Named Module）只能访问到它依
赖定义中列明依赖的模块和包，匿名模块里所有的内容对具名模块来说都是不可见的，即具
名模块看不见传统 JAR 包的内容。
JAR 文件在模块路径的访问规则：如果把一个传统的、不包含模块定义的 JAR 文件放置到
模块路径中，它就会变成一个自动模块（Automatic Module）。尽管不包含module-info.class，
但自动模块将默认依赖于整个模块路径中的所有模块，因此可以访问到所有模块导出的包，
自动模块也默认导出自己所有的包。

随着 JDK 9 模块化系统的引入，更值得关注的是它本身面临的模块间的管理和兼容性问题：
如果同一个模块发行了多个不同的版本，那只能由开发者在编译打包时人工选择好正确版本
的模块来保证依赖的正确性。Java 模块化系统目前不支持在模块定义中加入版本号来管理
和约束依赖，本身也不支持多版本号的概念和版本选择功能。

1.5.2 模块化下的类加载器

扩展类加载器（Extension Class Loader）被平台类加载器（Platform Class Loader）取
代。这其实是一个很顺理成章的变动，既然整个 JDK 都基于模块化进行构建（原来的 rt.jar
和 tools.jar 被拆分成数十个 JMOD 文件），其中的 Java 类库就已天然地满足了可扩展的需
求，那自然无须再保留\lib\ext 目录，此前使用这个目录或者 java.ext.dirs 系统变量来
扩展 JDK 功能的机制已经没有继续存在的价值了，用来加载这部分类库的扩展类加载器也完
成了它的历史使命。

最后，JDK 9 中虽然仍然维持着三层类加载器和双亲委派的架构，但类加载的委派关系也发
生了变动。当平台及应用程序类加载器收到类加载请求，在委派给父加载器加载前，要先判
断该类是否能够归属到某一个系统模块中，如果可以找到这样的归属关系，就要优先委派给
负责那个模块的加载器完成加载，也许这可以算是对双亲委派的第四次破坏。在 JDK 9 以后
的三层类加载器的架构如下图所示。
在这里插入图片描述