Java 类的加载时机和过程

1.什么是类加载?

运行在Java虚拟机之上的语言,比如Java、Scala、Groovy、JRuby等,会被各自的编辑器编译为Class文件,这些Class文件需要被加载进Java虚拟机才能运行。

类从被加载到虚拟机内存开始,到卸载出内存为止,它的整个生命周期包括:加载、验证、准备、解析、初始化、使用、卸载7个阶段。其中验证、准备、解析3个部分统称为连接。
图片来自网络,侵删
上图来自网络,侵删

2.类什么时候会被加载?

关于类什么时候被加载,Java虚拟机规范并没有做出硬性的规定,不同JVM可能有不同的实现。一般分为下面两种情况:

  1. 饿汉式(eagerly load):只要有其他类引用了它就加载
  2. 懒汉式(lazy load):类初始化的时候才加载

3.类加载过程

3.1 加载

在加载阶段,虚拟机需要完成3件事情:

1. 通过一个类的全限定名来获取定义此类的二进制字节流
2. 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
3. 在内存中生成一个代表该类的java.lang.Class对象,作为方法区这个类的各种数据访问入口。

虚拟机规范的这3点要求,其实并不具体,虚拟机实现的灵活度非常大。例如“通过一个类的全限定名来获取定义此类的二进制字节流”这条,它并没有指明要出哪里获取,怎么获取class文件,因此对于这一条,出现了很多花样:

  • 从ZIP包读取,这很常见,也是JAR、EAR、WAR格式的基础
  • 从网络中获取,典型的应用便是Applet
  • 运行时计算生成,这种场景使用最多的便是动态代理技术。在java.lang.reflect.Proxy中,就是用了ProxyGenerator.generateProxyClass来为特定接口生成形式为“*$Proxy”的代理类二进制字节流
  • 由其他文件生成,典型场景是JSP应用,即由JSP文件生成Class类

加载完成后,虚拟机外部的二进制字节流就按照虚拟机所需的格式存储在方法区之中。然后在内存中实例化一个java.lang.Class对象。

3.2 连接

连接阶段的开始,并不一定等到加载阶段结束。加载阶段与连接阶段的部分内容(如一部分字节码文件格式验证动作)是交叉进行的,加载阶段尚未完成,连接阶段可能已经开始,但这些夹杂在加载阶段之中的动作任然属于连接阶段,加载和连接这两个阶段的开始顺序是固定的。

3.2.1 验证

验证是连接阶段的第一步,这个阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。该阶段大致会完成以下4个阶段的检验动作:文件格式验证、元数据验证、字节码验证、 符号引用验证

3.2.2 准备

准备阶段会为类变量(被static修饰的变量)分配内存并设置类变量的初始值,这些变量所使用的内存都将在方法区中分配。假如有一个变量:

private static int value = 123;

那么value在准备阶段过后值是0,而不是123.因为这个时候尚未执行任何java方法,而把value赋值为123的动作在初始化阶段才会执行。

但是如果上面的变量被final修饰,变为:

private static final int value = 123;

编译时javac会为value生成ConstantValue属性,在准备阶段虚拟机就会根据ConstantValue的设置将value赋值为123。

关于ConstantValue属性的介绍,请参考添加链接描述

3.2.3 解析

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。

符号引用

符号引用以一组符号来描述所引用的目标。符号引用可以是任何形式的字面量,只要使用时能无歧义地定位到目标即可,符号引用和虚拟机的布局无关。个人理解为:在编译的时候每个java类都会被编译成一个class文件,但在编译的时候虚拟机并不知道所引用类的地址,所以就用符号引用来代替,而在这个解析阶段就是为了把这个符号引用转化成为真正的地址的阶段。

直接引用

直接引用可以直接指向目标的指针、相对偏移量或是一个能间接定位到目标的句柄。直接引用是和虚拟机实现的布局内存有关,同一个符号引用在不同虚拟机示例上翻译出来的直接引用一般不同。如果有了直接引用,那引用的目标必定已经在内存中存在。

解析动作主要针对类或接口、字段、类方法、接口方法、方法类型方法句柄和调用点限定符7类符号引用进行。

4. 初始化

4.1什么是类初始化?

类初始化是类加载过程的最后一步,这一步会真正开始执行类中定义的Java程序代码(或者说字节码)。
在准备阶段,变量已经被赋过一次系统要求的初始值,在初始化阶段,变量会再次赋值为程序员设置的值。比如变量:

private static int value = 123;

那么value在准备阶段过后值是0,初始化阶段后值是123。

<clinit>()方法

初始化的过程就是在执行<clinit>()方法

什么是<clinit>()方法

<clinit>()方法是由编译器自动收集类中的所有类变量的赋值动作和静态代码块中的语句合并产生的一个方法。
编辑器的收集顺序由源文件顺序决定。这也是为什么静态语句块中只能访问到定义在静态语句块以前的变量。定义在静态语句块之后的变量,可以在静态语句块中赋值,但是不能访问。

在这里插入图片描述

虚拟机会保证在<clinit>()方法执行之前,其父类的<clinit>()已经执行完毕。所以虚拟机中第一个被执行的<clinit>()肯定是java.lang.Object。
由于父类的<clinit>()先执行,也就意味着父类中定义的静态语句块要优先于子类的变量赋值操作。

    static class Parent{

        public static int A = 1;
        static {
            A = 2;
        }

    }

    static class Sub extends Parent {
        public static int B = A;
    }

    public static void main(String[] args) {
        System.out.println(Sub.B);
    }
    
输出:2

4.2 接口的<clinit>()方法

<clinit>()方法对于类或接口来说并不是必需的,如果一个类中没有静态代码块,也没有对变量的赋值操作,那么编译器可以不为这个类生成<clinit>()方法。

接口中虽然不能使用静态代码块,但是仍然可以进行变量的初始化赋值操作(在JDK1.5以前,使用接口定义常量非常普遍,在1.5以后,有了枚举作为替代),因此接口和类一样都会生成<clinit>()方法。

但是执行接口的<clinit>()方法不需要执行父接口的<clinit>()方法。只有当父接口中定义的变量使用时,父接口才会初始化。另外,接口的实现类在初始化时也不会执行接口的<clinit>()方法。

多线程环境下的<clinit>()方法

<clinit>()方法是阻塞的,在多线程环境下,如果多个线程同时去初始化一个类,那么只会有一个线程去执行这个类的<clinit>(),其他线程都会被阻塞。

  • 4
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值