虚拟机类加载机制
java虚拟机把描述类的数据从Class文件加载到内存,并堆数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这个过程被称作虚拟机的类加载机制
类加载的时机
类型从被加载到虚拟机内存中开始到卸载出内存为止的生命周期为:加载、验证、准备、解析、初始化、使用、卸载 总共七个阶段,其中验证、准备、解析三个部分统称为链接;加载、验证、准备、初始化和卸载是按照顺序执行的,而解析为了满足java动态绑定的需求可能会在初始化之后进行。
必须立即对类初始化的六种情况
虚拟机会为类和接口生成()类构造器,用于初始化接口中所定义的成员变量;当一个类初始化时要求其全部父类都已经初始化过,而接口初始化时只有真正使用到父接口时才会初始化
- 1、遇到new、getstatic(读取静态字段)、putstatic(设置静态字段)或invokestatic(调用静态方法)这四条字节码指令时。
- 2、使用java.lang.reflect包的方法对类型进行反射调用的时候
- 3、当初始化类时,要先初始化其父类
- 4、当虚拟机启动时,用户需要指定一个要执行的主类,虚拟机会先初始化这个主类
- 5、当使用jdk7加入的动态语言支持时,如果java.lang.invoke.MethodHandle实例最后的解析结果为REF_getStatic、REF_putStatic、REF_invokeStatic、REF_newInvokeSpecial四种类型的方法句柄时
- 6、当一个接口定义了JDK8新加入的默认方法时
类加载的过程
加载
开发人员可控性最强的阶段,主要表现在可以控制类二进制流的获取。数组是通过jvm自己创建的 再由类加载器创建数据中的元素类
-
1、通过一个类的全限定名获取此类的二进制字节流
虚拟机并没有规定怎样获取二进制字节流,可以从网络、加密文件、压缩包等等不同方式获取
-
2、将这个字节流所代表的静态储存结构转化为方法区的运行时数据结构
-
3、在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口
验证
这一阶段的目的是确保Class文件的字节流中包含的信息符合java虚拟机规范的全部约束要求,保证这些信息被当作代码运行后不会危害虚拟机自身的安全
-
文件格式验证
验证字节流是否符合Class文件格式的规范,并且能够被当前版本的虚拟机处理,只有通过了之后这段字节流才被允许进入java虚拟机内存的方法区中进行存储
- 1、是否以魔数0XCAFEBABE开头
- 2、主、次版本号是否在当前java虚拟机接受范围之内
- 3、常量池的常量中是否有不被支持的常量类型
- 4、指向常量的各种索引值中是否有指向不存在的常量或不符合类型的常量
- 5、CONSTANT_Uft8_info型的常量中是否有不符合UTF-8编码的数据
- 6、Class文件中各个部分及文件本省是否有被删除的或附加的其他信息
- 。。。等等
-
元数据验证
对字节码描述的信息进行语义分析,保证其描述的信息符合java语言规范的要求
- 1、这个类是否有父类(除了java.lang.Object以外的类都有父类)
- 2、这个类的父类是否继承了不允许被继承的类(final修饰的类)
- 3、如果这个类不是抽象类,是否实现了其父类或者接口之中要求实现的所有方法
- 4、类中的字段、方法是否与父类产生矛盾
- 。。。等等
-
字节码验证
主要目的是通过数据流分析和控制流分析确定程序语义是合法的符合逻辑的。
- 1、保证任意时刻操作数栈的数据类型与指令代码序列都能配合工作
- 2、保证任何跳转指令都不会跳转到方法体以外的字节码指令上
- 3、保证方法体中的类型转换总是有效的
- 。。。等等
-
符号引用验证
该类是否缺少或者被禁止访问它依赖的某些外部类、方法、字段等资源
- 1、符号引用中通过字符串描述的全限定名是否能找到对应的类
- 2、在指定类中是否存在符合方法的字段描述符及简单名称所描述的方法和字段
- 3、符号引用中的类、字段、方法的可访问性是否可被当前类访问
- 。。。等等
准备
准备阶段是正式为类中定义的变量(静态变量)分配内存并设置类变量初始值的阶段;jdk7以上的版本中 类变量随着Class对象一起存放在java堆中;此阶段实例变量不会分配内存,它会在对象实例化时随着对象一起分配在java堆中;此阶段会为类变量赋予系统要求的初始零值
解析
解析阶段是java虚拟机将常量池内的符号引用替换为直接引用的过程,解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符
-
符号引用
符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能够无歧义的定位到目标即可。例如,在Class文件中它以CONSTANT_Class_info、CONSTANT_Fieldref_info、CONSTANT_Methodref_info等类型的常量出现。符号引用与虚拟机的内存布局无关,引用的目标并不一定加载到内存中。在Java中,一个java类将会编译成一个class文件。在编译时,java类并不知道所引用的类的实际地址,因此只能使用符号引用来代替。比如org.simple.People类引用了org.simple.Language类,在编译时People类并不知道Language类的实际内存地址,因此只能使用符号org.simple.Language(假设是这个,当然实际中是由类似于CONSTANT_Class_info的常量来表示的)来表示Language类的地址。各种虚拟机实现的内存布局可能有所不同,但是它们能接受的符号引用都是一致的,因为符号引用的字面量形式明确定义在Java虚拟机规范的Class文件格式中。
-
直接引用
直接引用可以是
(1)直接指向目标的指针(比如,指向“类型”【Class对象】、类变量、类方法的直接引用可能是指向方法区的指针)
(2)相对偏移量(比如,指向实例变量、实例方法的直接引用都是偏移量)
(3)一个能间接定位到目标的句柄
直接引用是和虚拟机的布局相关的,同一个符号引用在不同的虚拟机实例上翻译出来的直接引用一般不会相同。如果有了直接引用,那引用的目标必定已经被加载入内存中了。 -
1、类或接口的解析
假设当前代码所处的类为D,如果要把一个从未解析过的符号引用N解析为一个类或者接口C的直接引用,需要三步
- 1.1 如果C不是数组,虚拟机将用D类的类加载器加载N
- 1.2 如果C是数组并且数组元素类型为对象,就按照1.1的规则加载元素类型 然后由虚拟机生成一个代表该数组维度和元素的数组对象
- 1.3 进行符号引用验证 确认D是否具备C的访问权限
-
2、字段解析
要确保java虚拟机获得字段唯一的解析结果
- 2.1 首先解析字段所属类或接口,用变量C表示
- 2.2 如果C本身就包含了简单名称和字段描述符都与目标相匹配的字段,则返回这个字段的直接引用,查找结束
- 2.3 如果C中实现了接口,将按照继承关系从下往上递归搜索各个接口和它的父接口,如果找到相匹配的字段则返回字段的直接引用,查找结束
- 2.4 如果C不是java.lang.Object 将会按照继承关系从下往上递归搜索其父类,如果在父类中找到相匹配的字段则返回字段的直接引用 查找结束
- 2.5 如果还没找到则抛出 java.lang.NoSuchFieldError异常 查找失败
- 2.6 如果查找成功就对字段进行权限验证
-
3、类的方法解析
- 3.1 首先解析字段所属类或接口,用变量C表示
- 3.2 检查C是否为类 如果发现C是个接口就直接抛出异常
- 3.3 在C中找到相匹配的方法返回方法的直接引用,查找结束
- 3.4 在C的父类中递归查找 如果有相匹配的方法返回方法的直接引用,查找结束
- 3.5 在C的实现接口列表中查找,如果存在相匹配的方法说明C是一个抽象类,抛出AbstractMethodError异常 查找结束
- 3.6 否则查找失败 抛出NoSuchMethodError异常
- 3.7 如果查找成功则进行权限校验
-
4、接口方法解析
- 与类方法解析相似
初始化
这个是类加载的最后一个步骤,会根据程序员的主管计划去初始化类变量和其他资源;
-
()
初始化也可以说是执行类构造器()方法的过程,
- ()是编译器自动收集类中的所有类变量的赋值动作和静态语句块中的语句合并产生的
- 不需要显示的调用父类构造器,java虚拟机保证父类的() 先执行,意味着父类的静态语句赋值操作要优先于子类先执行
- 这个方法不是必须的,如果一个类中没有静态代码块,也没有类变量的赋值操作那么也可以不生成此方法
- 接口中执行此方法不需要先执行父接口的()方法 只有父接口中定义的变量被使用时父接口才会初始化
- 接口实现类初始化时也不会执行接口()方法
- Java虚拟机必须保证一个类的()是线程安全的
类加载器
类加载器定义:通过一个类的全限定名来获取描述该类的二进制字节流的代码
类与类加载器
任意一个类都必须由加载它的类加载器和这个类本身一起共同确定其在java虚拟机总的唯一性
双亲委派模型
只存在两种不同的类加载器,一种是启动类加载器,这个类加载器使用C++语言实现,是虚拟机的一部分;另一个种是其他所有类的加载器,这些类加载器都由java语言实现,独立存在于虚拟机外部,并且全部继承自抽象类java.lang.ClassLoader; 双亲委派模型要求除了顶层的启动类加载器外,其余的类加载器都应有自己的父类,父子关系通常是使用组合关系来复用父加载器的代码
-
类加载器分类
-
启动类加载器
启动类加载器无法被java程序直接引用
- 负责加载存放在<JAVA_HOME>\lib目录或者被 -Xboostclasspath参数所指定的路径中存放的而且是java虚拟机能够识别的类库加载到虚拟机的内存中
-
扩展类加载器
- 在sum.misc.Launcher$ExtClassLoader中以java代码形式实现的 负责加载<JAVA_HOME>\lib\ext目录中,或者被java.ext.dirs系统变量所指定的路径中所有的类库
-
应用程序类加载器
- 在sum.misc.Launcher$AppClassLoader中以java代码形式实现的,负责加载用户类路径上所有的类库,一般情况下这个就是程序中默认的类加载器
-
-
工作过程
- 如果一个类加载器要加载一个类,首先把请求委派给父类加载器去完成,每一个层次的类加载器都是如此,只有当父加载器反馈自己无法完成这个加载请求时子加载器才会尝试去完成加载
- 优点:类会随着它的类加载器一起具备一种带有优先级的层次关系,避免核心类被篡改
-
破坏双亲委派
- 1、兼容以前的版本,双亲委派机制出现在jdk1.2之后才引入,但是java.lang.ClassLoader在第一个版本中就已经出现,所以为了兼容以前的代码必须做出妥协,在ClassLoader中增加findClass()方法并引导用户重写此方法
- 2、模型自身缺陷,基础类型无法回调用户的代码,也可以说父类加载器要加载子类加载器负责加载的类,解决方法是增加线程上下文类加载器,让用户可以设置要回调的子类加载器
- 3、满足用户对程序的动态性追求,指代码热替换、模块热部署等等,典型应用是OSGI