对java类加载机制的详细解读

类的加载过程解读:

ClassLoader的主要职责就是负责加载各种class文件到JVM中, ClassLoader是一个抽·象的class,给定一个class的二进制文件名, ClassLoader会尝试加载并且在JVM中生成构成这个类的各个数据结构,然后使其分布在JVM对应的内存区域中。
一、类的加载过程简介
类的加载过程一般分为三个比较大的阶段-分别是加载阶段、连接阶段和初始化阶段
在这里插入图片描述
加载阶段:主要负责查找并且加载类的二进制数据文件,其实就是class文件。
连接阶段:连接阶段所做的工作比较多,细分的话还可以分为如下三个阶段。
验证:主要是确保类文件的正确性,比如class的版本, class文件的魔术因子是否正确。
准备:为类的静态变量分配内存,并且为其初始化默认值。
解析:把类中的符号引用转换为直接引用。
初始化阶段:为类的静态变量赋予正确的初始值(代码编写阶段给定的值)。当一个JVM在我们通过执行Java命令启动之后,其中可能包含的类非常多,是不是每一个类都会被初始化呢?答案是否定的, JVM对类的初始化是一个延迟的机制,即使用的是lazy的方式,当一个类在首次使用的时候才会被初始化,在同一个运行时包下,一个Class只会被初始化一次。

二、类的加载过程详解

1、类的加载阶段

简单来说,类的加载就是将class文件中的二进制数据读取到内存之中,然后将该字节流所代表的静态存储结构转换为方法区中运行时的数据结构,并且在堆内存中生成一个该类的java.lang.Class对象,作为访问方法区数据结构的入口,如图所示。类被加载后在栈内存中的分布情况
在这里插类被加载后在栈内存中的分布情况 入图片描述
类加载的最终产物就是堆内存中的class对象,对同一个ClassLoader来讲,不管某个类被加载了多少次,对应到堆内存中的class对象始终是同一个。虚拟机规范中指出了类的加载是通过一个全限定名(包名+类名)来获取二进制数据流,但是并没有限定必须通过某种方式去获得,比如我们常见的是class二进制文件的形式,但是除此之外还会有如下的几种形式。
①运行时动态生成,比如通过开源的ASM包可以生成一些class,或者通过动态代理java.lang.Proxy也可以生成代理类的二进制字节流。
②通过网络获取,比如很早之前的Applet小程序,以及RMI动态发布等。
③通过读取zip文件获得类的二进制字节流,比如jar, war (其实, jar和war使用的是和zip同样的压缩算法)。
④将类的二进制数据存储在数据库的BLOB字段类型中。
⑤运行时生成class文件,并且动态加载,比如使用Thrift, AVRO等都是可以在运行时将某个Schema文件生成对应的若干个class文件,然后再进行加载。
注意我们在这里所说的加载是类加载过程中的第一个阶段,并不代表整个类已经加载完成了,在某个类完成加载阶段之后,虚拟机会将这些二进制字节流按照虚拟机所需的格式存储在方法区中,然后形成特定的数据结构,随之又在堆内存中实例化一个java.langClass类对象,在类加载的整个生命周期中,加载过程还没有结束,连接阶段是可以交叉工作的,比如连接阶段验证字节流信息的合法性 但是总体来讲加载阶段肯定是出现在连接阶段之前的。

2、类的连接阶段
类的连接阶段可以细分为三个小的过程,分别是验证、准备和解析,在本节中,我们,将详细介绍每一个过程的具体细节。
验证
在连接阶段中的主要目的是确保class文件的字节流所包含的内容符合当前JVM的规范要求,并且不会出现危害JVM自身安全的代码,当字节流的信息不符合要求时,则会抛出VerifyError这样的异常或者是其子异常。既然是验证,那么它到底验证了那些信息呢?
(1)验证文件格式
①在很多二进制文件中,文件头部都存在着魔术因子,该因子决定了这个文件到底是什么类型, class文件的魔术因子是0xCAFEBABE
②主次版本号, Java的版本是在不断升级的, JVM规范同样也在不断升级,比如你用高版本的JDK编译的class就不能够被低版本的JVM所兼容,在验证的过程中,还需要查看当前的class文件版本是否符合当前JDK所处理的范围。
③构成class文件的字节流是否存在残缺或者其他附加信息,主要是看class的MD5指纹(每一个类在编译阶段经过MD5摘要算法计算之后,都会将结果一并附加给class字节流作为字节流的一部分)。
④常量池中的常量是否存在不被支持的变量类型,比如int64
⑤指向常量中的引用是否指到了不存在的常量或者该常量的类型不被支持。
⑥其他信息。
当然了, JVM对class字节流的验证远不止于此,由于获得class字节流的来源各种各样,甚至可以直接根据JVM规范编写出一个二进制字节流,对文件格式的验证可以在class被初始化之前将一些不符合规范的、恶意的字节流拒之门外,文件格式的验证充当了先锋关卡。
(2)元数据的验证
①元数据的验证其实是对class的字节流进行语义分析的过程,整个语义分析就是为了确保class字节流符合JVM规范的要求。
②检查这个类是否存在父类,是否继承了某个接口,这些父类和接口是否合法,或者是否真实存在。
③检查该类是否继承了被final修饰的类,被final修饰的类是不允许被继承并且其中的方法是不允许被override的。
④检查该类是否为抽象类,如果不是抽象类,那么它是否实现了父类的抽象方法或者接口中的所有方法。
⑤检查方法重载的合法性,比如相同的方法名称、相同的参数但是返回类型不相同,这都是不被允许的。
⑥其他语义验证。
(3)字节码验证
当经过了文件格式和元数据的语义分析过程之后,还要对字节码进行进一步的验证,该部分的验证是比较复杂的,主要是验证程序的控制流程,比如循环、分支等。
保证当前线程在程序计数器中的指令不会跳转到不合法的字节码指令中去。
保证类型的转换是合法的,比如用A声明的引用,不能用B进行强制类型转换。
保证任意时刻,虚拟机栈中的操作栈类型与指令代码都能正确地被执行,比如在压栈的时候传入的是一个A类型的引用,在使用的时候却将B类型载入了本地变量表。
其他验证。
(4)符号引用验证我们说过,在类的加载过程中,有些阶段是交叉进行的,比如在加载阶段尚未结束之前,连接阶段可能已经开始工作了,这样做的好处是能够提高类加载的整体效率,同样符号引用的验证,其主要作用就是验证符号引用转换为直接引用时的合法性。
通过符号引用描述的字符串全限定名称是否能够顺利地找到相关的类。
符号引用中的类、字段、方法,是否对当前类可见,比如不能访问引用类的私有方法。
其他。符号引用的验证目的是为了保证解析动作的顺利执行,比如,如果某个类的字段不存在,则会抛出NoSuchFieldError,若方法不存在时则抛出NoSuchMethodError等,我们在使用反射的时候会遇到这样的异常信息。
准备
当一个class的字节流通过了所有的验证过程之后,就开始为该对象的类变量,也就是静态变量,分配内存并且设置初始值了,类变量的内存会被分配到方法区中,不同于实例变量会被分配到堆内存之中。所谓设置初始值,其实就是为相应的类变量给定一个相关类型在没有被设置值时的默认值,不同的数据迷刑及其初始值。
在这里插入图片描述
例如:
为类变量设置初始值的代码如下:

public class LinkedPrepareprivate static int a =10;
  private final static int b = 10;

其中static int a=10在准备阶段不是10,而是初始值0,当然final static int b则还会是10,为什么呢?因为final修饰的静态变量(可直接计算得出结果)不会导致类的初始化,-是一种被动引用,因此就不存在连接阶段了。当然了更加严谨的解释是final static int b= 10在类的编译阶段javac会将其value生成一个ConstantValue属性,直接赋予10.
解析
在连接阶段中经历了验证、准备之后,就可以顺利进入到解析过程了,当然在解析的过程中照样会交叉一些验证的过程,比如符号引用的验证,所谓解析就是在常量池中寻找类、接口、字段和方法的符号引用,并且将这些符号引用替换成直接引用的过程:

public class ClassResolvestaticSimple simple = new Simple();
public static void main(string[] args)System.out.println(simple);}}

在上面的代码中ClassResolve用到了Simple类,我们在编写程序的时候,可以直接使用simple这个引用去访问Simple类中可见的属性及方法,但是在class字节码中可不是这么简单,它会被编译成相应的助记符,这些助记符称为符号引用,在类的解析过程中,助记符还需要得到进一步的解析,才能正确地找到所对应的堆内存中的Simple数据结构。还包括对类接口、字段、类方法、接口方法的解析。
类的初始化阶段
经历了层层关卡,终于来到了类的初始化阶段,类的初始化阶段是整个类加载过程中的最后一个阶段,在初始化阶段做的最主要的一件事情就是执行<clinit0方法的过程(clinit是class initialize前面几个字母的简写)在<clinit0)方法中所有的类变量都会被赋予正确的值,也就是在程序编写的时候指定的值。<clinit0)方法是在编译阶段生成的,也就是说它已经包含在了class文件中了,<clinit)中包含了所有类变量的赋值动作和静态语句块的执行代码,编译器收集的顺序是由执行语句在源文件中的出现顺序所决定的(<clinit0是能够保证顺序性的),另外需要注意的一点是,静态语句块只能对后面的静态变量进行赋值,但是不能对其进行访问。
另外<clinit0方法与类的构造函数有所不同,它不需要显示的调用父类的构造器,虚拟机会保证父类的<clinit()方法最先执行,因此父类的静态变量总是能够得到优先赋值.
本次的类加载过程讲解到这就结束了,有什么不对的地方希望各位老铁,积极指正。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值