Java虚拟机:类加载机制

前言

虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制。

类加载

类从被虚拟机加载到内存中开始,到卸载出内存为止,它的整个生命周期包括:加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)、卸载(Unloading)。一共7个阶段,其中验证、准备、解析3个阶段统称为连接(Linking)。

具体过程如下
类加载
加载、验证、准备、初始化、卸载这5个阶段的顺序是确定的,而解析阶段不一定,它在某些情况下可以在初始化阶段后再开始,这是为了支持Java语言的动态绑定(也称运行时绑定)。

虚拟机规范中规定了五种情况下,类必须马上被初始化(加载、验证、准备在此之前完成):

  • 遇到new、getstatic、putstatic或invokestatic这四条字节码指令时,如果类没有进行过初始化,则需要先触发其初始化。生成这四条指令最常见的场景就是:使用new关键字进行对象实例化得时候、读取或设置一个类的静态属性的时候(被final修饰,已在编译期把结果放入常量池的静态字段除外)、调用一个类的静态方法时
  • 使用java.lang.reflect包下的方法对类进行反射调用的时候,如果类没有进行过初始化,则会先触发其初始化。
  • 当一个类进行初始化时,其父类还没有进行初始化,会先初始化父类
  • 虚拟机启动时,用户需要指定一个要执行的主类(包含main方法的类),虚拟机会先初始化这个主类
  • 当使用JDK1.7动态语言支持时,如果一个java.lang.invoke.MethodHandle实例最后解析的结果REF_getStatic、REF_putStatic、REF_invokeStatic的方法句柄,并且这个方法句柄对应的类没有被初始化,则需要先触发其初始化

加载

加载是类加载的一个阶段,在加载阶段,虚拟机需要完成三件事:

  • 根据类的全限定名称获取定义此类的二进制字节流
  • 将这个字节流定义的静态存储结构转换为方法区的运行时数据结构
  • 在内存中生成一个表达该类的java.lang.Class对象,作为方法区这个类的各种数据访问入口

注意:二进制字节流不一定是从Class文件中获取的,除了直接从Class文件中获取外,还可以从以下途径获取

  • 从zip包中读取,例如:jar包、war包、ear包
  • 从网络中获取,例如:Applet
  • 运行时动态生成,例如:动态代理
  • 由其他文件生成,例如:JSP技术
  • 从数据库中获取

验证

这一步的目的是确保Class文件中的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身安全。Java语言编译生成的Class文件是相对安全的,但是Class文件不一定是Java源代码编译生成的,所以验证是虚拟机自我保护的一项重要工作。验证过程大致分为四个阶段:文件格式验证、元数据验证、字节码验证、符号引用验证。

文件格式验证

这一阶段主要验证字节流是否符合Class文件格式的规范,并且能被当前版本的虚拟机所处理。这一阶段可能包含下面的验证点:

  • 是否以魔数0xCAFEBABE开头
  • 主、次版本号是否在当前虚拟机处理范围
  • 常量池中是否有不被支持的常量类型

这一阶段的目的是保证输入的字节流能正确的解析并存储于方法区内。这个阶段的验证是基于二进制流实现的,只有通过了这个阶段后,字节流才会进入方法区中进行存储,所以后面的三个验证都是基于方法区的存储结构进行的,不会再操作二进制流。

元数据验证

这个阶段是对字节码描述的信息进行语义分析,以保证其描述的信息符合虚拟机规范的要求。这一阶段可能包含下面的验证点:

  • 这个类是否有父类(除了java.lang.Object外,所有的类都应该有父类)
  • 这个类的父类是否继承了不允许被继承的类(final修饰的类)
  • 如果这个类不是抽象类,是否实现了父类或接口要求实现的所有方法
  • 类中的字段、方法是否与父类产生了矛盾(覆盖了父类的final字段、不符合规范的方法重载等)

这一阶段的主要目的是对类的元数据进行校验,保证不存在不符合Java语言规范的元数据信息

字节码验证

这个阶段是整个验证阶段最复杂的一个阶段,主要目的是通过数据流和控制流分析确定程序语义是合法的、符合逻辑的。在第二个阶段对元数据信息中的数据类型做完校验后,这个阶段将对类的方法体进行校验分析,保证被校验的类的方法在运行时不会做出危害虚拟机安全的事件,例如:

  • 保证任意时刻,操作数栈的数据的数据类型与指令代码序列都能配合工作,例如不会出现类似这样的情况:在操作数栈放置一个int类型数据,使用时却按long类型来加载入本地变量表
  • 保证跳转指令不会跳转到方法体以外的字节码指令上
  • 保证方法体中的类型转换是有效的,例如可以把一个子类对象赋值给父类数据类型,这是安全的,但是把父类数据类型赋值给子类,甚至把对象赋值给和他毫不相干的数据类型,则是危险和不合法的

如果一个类的方法体字节码通过了字节码验证,不能说明他是安全的;如果没通过,那肯定是不安全的。

符号引用验证

最后一个阶段的验证发生在虚拟机将符号引用转化为直接引用的时候,这个转化将在连接的第三个阶段——解析阶段中发生。符号引用验证可以看做是对类自身以外(常量池中各种符号引用)的信息进行匹配性校验,通常需要校验以下内容:

  • 符号引用中通过字符串描述的全限定名是否能找到对应的类
  • 在指定类中是否存在符合方法的字段描述符以及简单名称所描述的方法和字段
  • 符号引用中的类、字段、方法的访问性(private、default、protected、public)是否可以被当前类访问

符号引用验证的目的是确保解析动作能正常执行。

准备

准备阶段是正式为类变量分配内存并设置初始值(零值)的阶段,这些变量所使用的内存都在方法区进行分配。这里的类变量是指被static修饰并且不被final修饰的变量,首先它是类变量而不是实例变量,实例变量会在对象实例化的时候随着对象一起分配在堆区,其次他不被final修饰,假设一个变量定义为:
private static int value = 123
在准备阶段过后,value的值是0(也就是零值),而不是123,因为这时尚未执行任何Java方法,把value的值赋值为123将在初始化阶段进行。如果类变量被final修饰就是常量:
private static final int value = 123
在准备阶段过后,value的值是123,而不是0。
各种数据类型对应的零值如下:

数据类型零值数据类型零值
byte(byte)0double0.0d
short(short)0char‘\u0000’
int0booleanfalse
long0Lreferencenull
float0.0f

解析

解析是将常量池中的符号引用替换为直接引用的过程。
符号引用包含了下面三类常量:

  • 类和接口的全限定名称(Fully Qualified Name)
  • 字段的名称和描述符
  • 方法的名称和描述符

Java代码在Javac编译的时候,没有“连接”这个步骤,而是在虚拟机加载Class文件的时候进行动态连接。也就是说Class文件并不会保存各个方法、字段的最终内存布局信息,因此这些方法、字段的符号引用如果不经过运行期转换的话无法得到真正的内存入口地址,也就无法直接被虚拟机使用。当虚拟机运行时,需要从常量池获取对应的符号引用,再在类创建或者运行时解析、翻译到对应的内存地址之中,这就是将符号引用替换为直接引用。

初始化

初始化是类加载的最后一步,前面的类加载过程中,除了加载阶段用户应用程序可以通过自定义类加载器参与之外,其余的阶段完全由虚拟机主导和控制。到了初始化阶段,才真正开始执行Java代码(字节码)。
在准备阶段,变量已经赋过一次初始值(零值),而初始化阶段会根据程序指定的值去给变量赋值。初始化阶段首先应该关注的是一个类中的初始化顺序,博主前面写过一篇关于类初始化顺序的博文:类初始化顺序

以上便是虚拟机类加载机制的主要过程。

参考

《深入理解Java虚拟机》

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值