三-类的加载过程详解

3.1 概述

  • Java中数据类型分为基本数据类型和引用数据类型。基本数据类型由虚拟机预先定义,引用数据类型则需要进行类的加载
  • 从class文件到加载到内存中的类,到类卸载出内存为止,整个生命周期
    生命周期
    从程序中类的使用过程看:

概述

大厂面试题:
描述JVM加载Class文件的原理机制
java类加载过程
类加载的时机

3.2 过程一:Loading(加载)阶段

3.2.1 加载完成的操作

  • 所谓加载,就是讲Java类的字节码文件加载到机器内存中,并在内存中构建出Java类的原型–类模板对象。所谓类模板对象,就是Java类在JVM内存中的一个快照,JVM讲字节码文件中解析出的常量池、类字段、类方法等信息存储到类模板中,这样JVM在运行期便能通过类模板而获取Java类中的任何信息,能对Java类的成员变量进行遍历,也能进行Java方法的调用
  • 反射的机制即基于这一基础。如果JVM没有讲Java类的声明信息存储起来,则JVM在运行期也无法反射
  • -XX:+TraceClassLoading可以追踪类的加载信息并打印出来

加载完成的操作

加载阶段,简言之,就是查找并加载类的二进制数据,生成Class的实例

在加载类时,Java虚拟机完成以下事情:

  1. 通过类的全名,获取类的二进制数据流
  2. 解析类的二进制数据流为方法区的数据结构(Java类模型)
  3. 创建java.lang.Class类的实例,表示该类型。作为方法区这个类的各个数据的访问入口

3.2.2 二进制流的获取方式

对于类的二进制数据流,虚拟机可以通过多种途径产生或获得

  • 虚拟机可能通过文件系统读入一个class后缀的文件(最常见)‘
  • 读入jar、zip等归档数据包,提取类文件
  • 事先存放在数据库中的类的二进制数据
  • 通过类似于HTTP之类的协议通过网络进行加载
  • 在运行生成一段class的二进制信息等

在获取类的二进制信息后,Java虚拟机就会处理这些数据,并最终转为一个java.lang.Class的实例

如果输入不是ClassFile结构,会抛出ClassFormatError

3.2.3 类模型与Class实例的位置

类模型的位置

加载的类在JVM中创建相应的类结构,类结构会存储在方法区(JDK8前:永久代,JDK8后:元空间)

Class实例的位置

类讲.class文件加载到元空间后,会在堆中创建一个java.lang.Class对象,用来封装类位于方法区内的数据结构,该Class对象是在加载类的过程中创建的,每个类都对应有一个Class类型的对象
外部图示
外部可以通过访问代表Order类的Class对象来获取Order的类数据结果

Class类的构造器是私有的,只有JVM能够创建
java.lang.Class实例时访问类型元数据的接口,也是实现反射的关键数据、入口。通过Class类提供的结构,可以获得目标类所关联的.class文件中具体的数据结构:方法、字段等信息。

3.2.4 数组类的加载

  • 创建数据类的情况有些特殊,因为数组类本身并不是由类加载器负责创建,而是由JVM在运行时根据需要而直接创建的,但数组的元素类型依然依靠类加载器去创建。创建数据类(A)的过程:
  • 如果数组的元素类型是引用类型,那么就遵循定义的加载过程递归加载和创建数组A的元素类型;
  • JVM使用指定的元素类型和数组维度来创建新的数组类

如果数组的元素类型是引用类型,数组类的可访问性就由元素类型的可访问性决定。否则数组类的可访问性被缺省定义为public

3.3 过程二:Linking(链接)阶段

3.3.1 链接阶段之验证(Verification)

  • 当类加载到系统后,就开始链接操作,验证是链接的第一步,目的是保证加载的字节码是合法、合理并符合规范的

验证
1.格式验证:

  • 是否以魔数OxCAFEBABE开头,主版本和副版本号是否在当前Java虚拟机的支持范围内,数据中每一项是否都拥有正确的长度等
  • 格式验证会和加载阶段一起执行。验证通过后,类加载器才会成功将类的二进制数据信息加载到方法区中
  • 格式验证之外的验证操作都会在方法区中进行。链接阶段的验证虽然拖慢了加载速度,但避免了在字节码运行时还需检查的时间

2.语义检查:

  • 但凡在语义上不符合规范的,虚拟机都不会予以验证通过,比如:
  • 是否所有的类都有父类
  • 是否一些被定义为final的方法或类被重写或继承了
  • 非抽象类是否实现了所有抽象方法或者接口方法
  • 是否存在不兼容的方法(abstract下的方法,就不能是final的了)

3.字节码验证:

  • 最复杂的一个过程,他试图通过对字节码流的分析,判断字节码是否可以被正确地执行,比如:
  • 在字节码的执行过程中,是否会跳转到一条不存在的指令
  • 函数的调用是否传递了正确类型的参数
  • 变量的赋值是不是给了正确的数据类型等
  • 栈映射帧(StackMapTable)就是在这个阶段,用于检测在特定的字节码处,其局部变量表和操作数栈是否有正确的数据类型

前面3次检查中,已排除了文件格式错误、语义错误、字节码不正确性,但依然不能确保类是没有问题的

4.符号引用验证:

  • Class文件在其常量池会通过字符串记录自己将要使用的其他类或方法。因此,在验证阶段,虚拟机就会检查这些类或方法确实是存在的,并且当前类有权访问这些数据。如果一个需要使用类无法在系统中找到,则会抛NoClassDefFoundError,如果一个方法无法被找到,则抛NoSuchMethodError
  • 此阶段在解析环节才会执行

3.3.2 链接阶段之准备(Preparation)

  • 简言之,为类的静态变量分配内存,并将其初始化为默认值
  • 当一个类验证通过时,虚拟机就会进入准备阶段。在这个阶段,虚拟机就会为这个类分配响应的内存空间,并设置默认初始值
类型默认初始值
byte(byte)0
short(short)0
int0
long0L
float0.0f
double0.0
char\u0000
boolean0
referencenull
/**
* 基本数据类型,非final修饰的变量,在准备环节进行默认初始化赋值
*               final修饰后,在准备环节直接进行显示赋值
* 如果使用字面量的方式,定义一个字符串的常量,也是在解析环节直接进行显示赋值
*/
public class LinkingTest {
    private static long id;
    private static final int num = 1;

    public static final String constStr = "CONST";
    public static final String constStr1 = new String("CONST");
}

3.3.3 链接阶段之解析(Resolution)

  • 将类、接口、字段和方法的符号引用转为直接引用
  • 符号引用就是一些字面量的引用,和虚拟机的内部数据结构和内存布局无关。
  • 举例:输出操作System.out.println()对应的字节码

解析

  • 通过解析操作,符号引用就可以转变为目标方法在类中方法表中的位置,从而使得方法被成功调用

3.4 过程三:Initialization(初始化)阶段

  • 简言之,为类的静态变量赋予正确的初始值
  • 是类的最后一个阶段,如果前面的步骤都没有问题,那么表示类可以顺利装载到系统中。此时,类才会开始执行Java代码

最重要的工作是执行类的初始化方法:<clinit.>()方法
1.此方法仅能由Java编译器生成并由JVM调用,程序开发中无法自定义一个同名的方法,更无法直接从Java程序中调用该方法,虽然该方法也是由字节码指令组成
2.他是由类静态成员的赋值语句以及static语句块合并产生的
3.父类的<clinit.>总是在子类<clinit.>之前被调用

/**
 *
 * 哪些场景下,Java 编译器就不会生成<clinit>()方法
 */
public class InitializationTest1 {
  //场景1:对应非静态的字段,不管是否进行了显式赋值,都不会生成<clinit>()方法
  public int num = 1;
  //场景2:静态的字段,没有显式的赋值,不会生成<clinit>()方法
  public static int num1;
  //场景3:比如对于声明为 static final 的基本数据类型的字段,不管是否进行了显式赋值,都不会生成<clinit>()方法
  public static final int num2 = 1;
}

3.4.1 static与final的搭配问题

/**
 *
 * 说明:使用 static + final 修饰的字段的显式赋值的操作,到底是在哪个阶段进行的赋值?
 * 情况1:在链接阶段的准备环节赋值
 * 情况2:在初始化阶段<clinit>()中赋值
 *
 * 结论:
 * 在链接阶段的准备环节赋值的情况:
 * 1. 对于基本数据类型的字段来说,如果使用 static final 修饰,则显式赋值(直接赋值常量,而非调用方法)通常是在链接阶段的准备环节进行
 * 2. 对于 String 来说,如果使用字面量的方式赋值,使用 static final 修饰的话,则显式赋值通常是在链接阶段的准备环节进行
 *
 * 在初始化阶段<clinit>()中赋值的情况
 * 排除上述的在准备环节赋值的情况之外的情况
 *
 * 最终结论:使用 static + final 修饰,且显示赋值中不涉及到方法或构造器调用的基本数据类型或String类型的显式赋值,是在链接阶段的准备环节进行
 */
public class InitializationTest2 {
    public static int a = 1; //在初始化阶段<clinit>()中赋值
    public static final int INT_CONSTANT = 10;  //在链接阶段的准备环节赋值

    public static final Integer INTEGER_CONSTANT1 = Integer.valueOf(100);   //在初始化阶段<clinit>()中赋值
    public static Integer INTEGER_CONSTANT2 = Integer.valueOf(1000); //在初始化阶段<clinit>()中赋值

    public static final String s0 = "helloworld0"; //在链接阶段的准备环节赋值
    public static final String s1 = new String("helloworld1"); //在初始化阶段<clinit>()中赋值

}

3.4.2 <clinit.>()的线程安全性

  • 对于<clinit.>()方法的调用,也就是类的初始化,虚拟机会在内部确保其多线程环境中的安全性
  • 在多线程环境中被正确地加锁、同步,如果多个线程同时去初始化一个类,那么只会有一个线程去执行这个类地<clinit.>()方法,其他线程都需要阻塞等待,直到活动线程执行完方法
  • 如果在一个类的<clinit.>()方法中有耗时很长的操作,就可能造成多个线程阻塞,引发死锁。并且这种死锁很难发现,因为看起来他们没有可用的锁信息

3.4.3 类的初始化情况:主动使用vs被动使用

主动使用

Class只有在必须要首次使用的时候才会被装载,Java虚拟机不会无条件地装载Class类型。一个类或接口在初始使用前,必须要进行初始化,主动使用只有几种情况:

  1. 当创建一个类地实例时,比如使用new关键字,或者通过反射、克隆、反序列化
  2. 当调用类地静态方法时,即当使用了字节码invokestatic指令
  3. 当使用类、接口的静态字段(final修饰符特殊考虑),比如getstatic或putstatic指令
  4. 当使用java.lang.reflect包中地方法反射类地方法时,比如Class.forName(" xxx.xxx.xxx")
  5. 当初始化子类时,如果发现其父类还没有进行过初始化,则需要先触发父类地初始化,不适用于接口。
  6. 如果一个接口定义了default方法,那么直接实现或间接实现该接口的类的初始化,该接口要在其之前被初始化
  7. 当虚拟机启动时,用户需要指定一个要执行的主类(包含main()方法的那个类),虚拟机会先初始化这个主类
  8. 当初此调用MethodHandle实例时,初始化该MethodHandle指向的方法所在的类

被动使用

除了以上的情况属于主动使用,其他的情况都属于被动使用。被动使用不会引起类的初始化

  1. 当访问一个静态字段时,只有真正声明这个字段的类才会被初始化。当通过子类引用父类的静态变量,不会导致子类初始化
  2. 通过数组定义类引用,不会触发此类的初始化
  3. 引用常量不会触发此类或接口的初始化。因为常量在链接阶段就已经被显示赋值了
  4. 调用ClassLoader类的loadClass()方法加载一个类

3.5 过程四:类的Using(使用)

  • 任何一个类型在使用之前必须经过完整的加载、链接和初始化3个类加载步骤
  • 开发人员可以在程序中访问和调用它的静态类成员信息(比如静态字段、静态方法),或使用new为其创建对象实例

3.6 过程五:类的Unloading(卸载)

类、类的加载器、类的实例之间的引用关系

  • 在类加载器的内部实现中,用一个Java集合来存放所加载类的引用。另一方面,一个Class对象总是会引用它的类加载器,调用Class对象的getClassLoader()方法,就能获得它地类加载器。由此可见,代表某个类地Class实例与其类地加载器之间为双向关联关系
  • 一个类的实例总是引用代表这个类的Class对象,在Object类种定义了getClass()方法,这个方法返回代表对象所属类的Class对象的引用,此外,所有Java类都有一个静态属性class,它引用这个类的Class对象

类的生命周期

当Sample类被加载、链接和初始化后,它的生命周期就开始了,当代表Sample类的Class对象不再被引用,即不可触及时,Class对象就会结束生命周期,Sample类在方法区内的数据也会被卸载,从而结束Sample类的生命周期

类的卸载
类的卸载

  1. 启动类加载器加载的类型在整个运行期间是不可能被卸载的
  2. 被系统类加载器和扩展类加载器加载的类型在运行期间不太可能被卸载,系统类加载器实例或者扩展类的实例基本上在整个运行期间总能直接或间接地访问到
  3. 被开发中自定义的类加载器实例加载的类型只有在很简单的上下文环境中才能被卸载

综上三点,一个已经加载地类型被卸载地几率很小被卸载的时间是不确定的

方法区的垃圾回收

方法区的垃圾收集主要回收两部分内容:常量池废弃的常量和不再使用的类型

HotSpot虚拟机对常量池的回收策略时很明确的,只要常量池中的常量没有被任何地方引用,就可以被回收

判定一个类型是否属于“不再被使用的类”需要同时满足下面三个条件:

  • 该类所有的实例都已经被回收。也就是Java堆中不存在该类及其派生子类的实例
  • 加载该类的类加载器已经被回收,这个条件除非时经过精心设计的可替换的类加载器的场景,如OSGi、JSP的重加载等,否则通常很难达成的
  • 该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值