JVM系统学习之路系列演示代码地址:
https://github.com/mtcarpenter/JavaTutorial
嗨喽,小伙伴大家好,我是小春哥,今天是打卡 【JVM系统学习之路】
的第二篇文章 类加载子系统
,在学习本章节首先回顾 上一章节【JVM系统学习之路】JVM与Java体系结构
的JVM整体结构。
此图一定牢记于心,在接下来的 JVM 知识点都是从此图展开进行的,如果了解看过JVM 面试题,大家对此图应该还是比较熟悉,小春哥此图我都了解了,想要一个更完整的 JVM 架构图,有吗?有的,这事儿必须满足。请接住下图:
JVM 是一块难啃的骨头,吃骨髓之前,我们清洗,入锅,小火慢炖等工序,我们就从类加载开始啃,
类加载器与类的加载过程
- 类加载器子系统负责从文件系统或者网络中加载
Class
文件,class
文件在文件开头有特定的文件标识。 ClassLoader
只负责class
文件的加载,至于它是否可以运行,则由Execution Engine
决定。- 加载的类信息存放于一块称为方法区的内存空间。除了类的信息外,方法区中还会存放运行时常量池信息,可能还包括字符串字面量和数字常量(这部分常量信息是
Class
文件中常量池部分的内存映射)
class file
存在于本地硬盘上,可以理解为设计师画在纸上的模板,而最终这个模板在执行的时候是要加载到 JVM 当中来根据这个文件实例化出 n 个一模一样的实例。class file
加载到 JVM 中,被称为 DNA 元数据模板,放在方法区。- 在
.class文件->JVM->最终成为元数据模板
,此过程就要一个运输工具(类装载器Class Loader
),扮演一个快递员的角色
类的加载过程
/**
* 类加载子系统
*/
public class HelloLoader {
public static void main(String[] args) {
System.out.println("我已经被加载啦");
}
}
此段代码的加载过程如下
更为完整的加载过程,有加载、验证、准备、解析、初始化,如下图:
加载阶段
- 通过一个类的全限定名获取定义此类的二进制字节流
- 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
- 在内存中生成一个代表这个类的
java.lang.Class
对象,作为方法区这个类的各种数据的访问入口
加载class文件的方式
- 从本地系统中直接加载
- 通过网络获取,典型场景:Web Applet
- 从zip压缩包中读取,成为日后 jar、war 格式的基础
- 运行时计算生成,使用最多的是:动态代理技术
- 由其他文件生成,典型场景:JSP 应用从专有数据库中提取 .class 文件,比较少见
- 从加密文件中获取,典型的防 Class 文件被反编译的保护措施
链接阶段
验证 Verify
- 目的在于确保
Class
文件的字节流中包含信息符合当前虚拟机要求,保证被加载类的正确性,不会危害虚拟机自身安全。 - 主要包括四种验证,
文件格式验证
,元数据验证
,字节码验证
,符号引用验证
。
工具:Binary Viewer查看是否 class 文件,后续会讲解此工具
准备 Prepare
- 为类变量分配内存并且设置该类变量的默认初始值,即零值。
public class HelloApp {
private static int a = 1; // 准备阶段为0,在下个阶段,也就是初始化的时候才是1
public static void main(String[] args) {
System.out.println(a);
}
}
上面的变量a在准备阶段会赋初始值,但不是 1 ,而是 0。
- 这里不包含用 final 修饰的 static ,因为final在编译的时候就会分配了,准备阶段会显式初始化;
- 这里不会为实例变量分配初始化,类变量会分配在方法区中,而实例变量是会随着对象一起分配到Java堆中。
解析 Resolve
- 将常量池内的符号引用转换为直接引用的过程。
- 事实上,解析操作往往会伴随着JVM在执行完初始化之后再执行。
- 符号引用就是一组符号来描述所引用的目标。符号引用的字面量形式明确定义在《java虚拟机规范》的class文件格式中。直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。
- 解析动作主要针对类或接口、字段、类方法、接口方法、方法类型等。对应常量池中的
CONSTANT Class info
、CONSTANT Fieldref info
、CONSTANT Methodref info
等。
初始化阶段
- 初始化阶段就是执行类构造器法()的过程。
- 此方法不需定义,是
javac 编译器
自动收集类中的所有类变量的赋值动作和静态代码块中的语句合并而来。- 也就是说,当我们代码中包含 static 变量的时候,就会有 clinit 方法
- 构造器方法中指令按语句在源文件中出现的顺序执行。
- 不同于类的构造器。(关联:构造器是虚拟机视角下的())若该类具有父类,JVM会保证子类的()执行前,父类的()已经执行完毕。
- 任何一个类在声明后,都有生成一个构造器,默认是空参构造器
public class ClassInitTest {
private static int num = 1;
static {
num = 2;
number = 20;
System.out.println(num);
System.out.println(number); //报错,非法的前向引用
}
private static int number = 10;
public static void main(String[] args) {
System.out.println(ClassInitTest.num); // 2
System.out.println(ClassInitTest.number); // 10
}
}
类加载器分类
- JVM支持两种类型的类加载器 。分别为
引导类加载器(Bootstrap ClassLoader)
和自定义类加载器(User-Defined ClassLoader)
。 - 从概念上来讲,自定义类加载器一般指的是程序中由开发人员自定义的一类类加载器,但是 Java 虚拟机规范却没有这么定义,而是将所有派生于抽象类
ClassLoader
的类加载器都划分为自定义类加载器。 - 无论类加载器的类型如何划分,在程序中我们最常见的类加载器有
引导类加载器,Bootstrap ClassLoader
、扩展类加载器(Extension ClassLoader)
、系统类加载器(AppClassLoader)
,如下所示:
这里的四者之间是包含关系,不是上层和下层,也不是子系统的继承关系。下面通过一个例子,获取它不同的加载器
public class ClassLoaderTest {
public static void main(String[] args) {
// 获取系统类加载器
ClassLoader systemClassLoader = ClassLoader.getSystemClassLoader();
System.out.println(systemClassLoader);
// 获取其上层的:扩展类加载器
ClassLoader extClassLoader = systemClassLoader.getParent();
System.out.println(extClassLoader);
// 获取 根加载器
ClassLoader bootstrapClassLoader = extClassLoader.getParent();
System.out.println(bootstrapClassLoader);
// 获取自定义加载器
ClassLoader classLoader = ClassLoaderTest.class.getClassLoader();
System.out.println(classLoader);
// 获取String类型的加载器
ClassLoader classLoader1 = String.class.getClassLoader();
System.out.println(classLoader1);
}
}
上面得到的结果,可以看出根加载器无法直接通过代码获取,同时目前用户代码所使用的加载器为系统类加载器。同时我们通过获取 String 类型的加载器,发现是 null,那么说明 String 类型是通过根加载器进行加载的,也就是说 Java 的核心类库都是使用根加载器进行加载的。
sun.misc.Launcher$AppClassLoader@18b4aac2
sun.misc.Launcher$ExtClassLoader@1540e19d
null
sun.misc.Launcher$AppClassLoader@18b4aac2
null
虚拟机自带的加载器
启动类加载器(引导类加载器,Bootstrap ClassLoader)
- 这个类加载使用
C/C++语言
实现的,嵌套在 JVM 内部。 - 它用来加载 Java 的核心库(
JAVAHOME/jre/1ib/rt.jar
、resources.jar
或sun.boot.class.path
路径下的内容),用于提供 JVM 自身需要的类 - 并不继承自
Java.lang.ClassLoader
,没有父加载器。 - 加载扩展类和应用程序类加载器,并指定为他们的父类加载器。
- 出于安全考虑,
Bootstrap 启动类加载器
只加载包名为java
、javax
、sun
等开头的类
扩展类加载器(Extension ClassLoader)
- Java语言编写,由
sun.misc.Launcher$ExtClassLoader
实现。 - 派生于
ClassLoader
类 - 父类加载器为启动类加载器
- 从
java.ext.dirs
系统属性所指定的目录中加载类库,或从JDK的安装目录的jre/1ib/ext子目录(扩展目录)下加载类库。如果用户创建的JAR放在此目录下,也会自动由扩展类加载器加载。
应用程序类加载器(系统类加载器,AppClassLoader)
- java语言编写,由
sun.misc.LaunchersAppClassLoader
实现 - 派生于
ClassLoader
类 - 父类加载器为扩展类加载器
- 它负责加载环境变量
classpath
或系统属性java.class.path
指定路径下的类库 - 该类加载是程序中默认的类加载器,一般来说,Java 应用的类都是由它来完成加载
- 通过
classLoader#getSystemclassLoader()
方法可以获取到该类加载器
用户自定义类加载器
- 在Java的日常应用程序开发中,类的加载几乎是由上述3种类加载器相互配合执行的,在必要时,我们还可以自定义类加载器,来定制类的加载方式。
- 为什么要自定义类加载器?
- 隔离加载类
- 修改类加载的方式
- 扩展加载源
- 防止源码泄漏
用户自定义类加载器实现步骤:
- 开发人员可以通过继承抽象类
Java.lang.ClassLoader
类的方式,实现自己的类加载器,以满足一些特殊的需求 - 在
JDK1.2
之前,在自定义类加载器时,总会去继承ClassLoader
类并重写loadClass()
方法,从而实现自定义的类加载类,但是在 JDK1.2 之后已不再建议用户去覆盖loadclass()
方法,而是建议把自定义的类加载逻辑写在findclass()
方法中 - 在编写自定义类加载器时,如果没有太过于复杂的需求,可以直接继承
URIClassLoader
类,这样就可以避免自己去编写findclass()
方法及其获取字节码流的方式,使自定义类加载器编写更加简洁。
查看根加载器所能加载的目录
public class ClassLoaderTest1 {
public static void main(String[] args) {
System.out.println("*********启动类加载器************");
// 获取BootstrapClassLoader 能够加载的API的路径
URL[] urls = sun.misc.Launcher.getBootstrapClassPath().getURLs();
for (URL url : urls) {
System.out.println(url.toExternalForm());
}
// 从上面路径中,随意选择一个类,来看看他的类加载器是什么:得到的是null,说明是 根加载器
ClassLoader classLoader = Provider.class.getClassLoader();
}
}
得到的结果如下:
*********启动类加载器************
file:/E:/Software/JDK1.8/Java/jre/lib/resources.jar
file:/E:/Software/JDK1.8/Java/jre/lib/rt.jar
file:/E:/Software/JDK1.8/Java/jre/lib/sunrsasign.jar
file:/E:/Software/JDK1.8/Java/jre/lib/jsse.jar
file:/E:/Software/JDK1.8/Java/jre/lib/jce.jar
file:/E:/Software/JDK1.8/Java/jre/lib/charsets.jar
file:/E:/Software/JDK1.8/Java/jre/lib/jfr.jar
file:/E:/Software/JDK1.8/Java/jre/classes
null
ClassLoader 的使用说明
ClassLoader
类,它是一个抽象类,其后所有的类加载器都继承自 ClassLoader(不包括启动类加载器)
方法 | 说明 |
---|---|
getParent() | 返回该类加载器的父类加载器。 |
loadClass(String name) | 加载名称为 name 的类,返回的结果是 java.lang.Class 类的实例。 |
findClass(String name) | 查找名称为 name 的类,返回的结果是 java.lang.Class 类的实例。 |
findLoadedClass(String name) | 查找名称为 name 的已经被加载过的类,返回的结果是 java.lang.Class 类的实例。 |
defineClass(String name, byte[] b, int off, int len) | 把字节数组 b 中的内容转换成 Java 类,返回的结果是 java.lang.Class 类的实例。这个方法被声明为 final 的。 |
resolveClass(Class<?> c) | 链接指定的 Java 类。 |
sun.misc.Launcher
它是一个 java 虚拟机的入口应用
获取 ClassLoader
的途径
- 获取当前
ClassLoader:clazz.getClassLoader()
- 获取当前线程上下文的
ClassLoader:Thread.currentThread().getContextClassLoader()
- 获取系统的
ClassLoader:ClassLoader.getSystemClassLoader()
- 获取调用者的
ClassLoader:DriverManager.getCallerClassLoader()
双亲委派机制
Java 虚拟机对 class 文件采用的是 按需加载
的方式,也就是说当需要使用该类时才会将它的 class 文件加载到内存生成 class 对象。而且加载某个类的 class 文件时,Java 虚拟机采用的是 双亲委派模式
,即把请求交由父类处理,它是一种 任务委派模式
。
工作原理
- 如果一个类加载器收到了类加载请求,它并不会自己先去加载,而是把这个请求委托给父类的加载器去执行;
- 如果父类加载器还存在其父类加载器,则进一步向上委托,依次递归,请求最终将到达顶层的启动类加载器;
- 如果父类加载器可以完成类加载任务,就成功返回,倘若父类加载器无法完成此加载任务,子加载器才会尝试自己去加载,这就是
双亲委派模式
。
双亲委派机制举例
当我们加载 jdbc.jar
用于实现数据库连接的时候,首先我们需要知道的是 jdbc.jar
是基于 SPI 接口进行实现的,所以在加载的时候,会进行双亲委派,最终从根加载器中加载 SPI核心类,然后在加载 SPI 接口类,接着在进行反向委派,通过线程上下文类加载器进行实现类 jdbc.jar
的加载。
沙箱安全机制
自定义 string 类,但是在加载自定义 String 类的时候会率先使用引导类加载器加载,而引导类加载器在加载的过程中会先加载 jdk 自带的文件(rt.jar包中 java\lang\String.class
),报错信息说没有 main 方法,就是因为加载的是 rt.jar 包中的 string 类。这样可以保证对 java 核心源代码的保护,这就是沙箱安全机制。
双亲委派机制的优势
通过上面的例子,我们可以知道,双亲机制可以:
- 避免类的重复加载
- 保护程序安全,防止核心API被随意篡改
- 自定义类:
java.lang.String
- 自定义类:
java.lang.ShkStart
(报错:阻止创建java.lang
开头的类)
- 自定义类:
如何判断两个class对象是否相同
- 在JVM中表示两个class 对象是否为同一个类存在两个必要条件:
- 类的完整类名必须一致,包括包名。
- 加载这个类的
ClassLoader
(指ClassLoader
实例对象)必须相同。
- 换句话说,在 JVM 中,即使这两个类对象(class对象)来源同一个 Class 文件,被同一个虚拟机所加载,但只要加载它们的
ClassLoader
实例对象不同,那么这两个类对象也是不相等的。 - JVM必须知道一个类型是由启动加载器加载的还是由用户类加载器加载的。如果一个类型是由用户类加载器加载的,那么JVM会将这个类加载器的一个引用作为类型信息的一部分保存在方法区中。当解析一个类型到另一个类型的引用的时候,JVM需要保证这两个类型的类加载器是相同的。
类的主动使用和被动使用
Java程序对类的使用方式分为:主动使用和被动使用。
- 主动使用,又分为七种情况:
- 创建类的实例
- 访问某个类或接口的静态变量,或者对该静态变量赋值
- 调用类的静态方法I
- 反射(比如:
Class.forName("com.atguigu.Test"
)) - 初始化一个类的子类
- Java虚拟机启动时被标明为启动类的类
- JDK7开始提供的动态语言支持:
java.lang.invoke.MethodHandle
实例的解析结果REF getStatic、REF putStatic、REF invokeStatic
句柄对应的类没有初始化,则初始化
- 除了以上七种情况,其他使用Java类的方式都被看作是对类的被动使用,都不会导致类的初始化。
总结
本篇文章开始回顾了 JVM 结构图,并完善了 JVM 完整的结构图,接下来开始学习类加载,类加载的过程有分为三个阶段,分别是 加载阶段(引导类、扩展类、系统类加载器)
、 链接阶段(验证、准备、解析)
、 初始化阶段
。接下来还介绍了虚拟机的加载器, 启动类加载器
、 扩展类加载器
、 引用类加载器
。还有被面试问的比较多的是双亲委派机制。
欢迎关注公众号 山间木匠 , 我是小春哥,从事 Java 后端开发,会一点前端、通过持续输出系列技术文章以文会友,如果本文能为您提供帮助,欢迎大家关注、点赞、分享支持,我们下期再见!