[深入理解Java虚拟机] 第8章 虚拟机字节码执行引擎

运行时栈帧结构

1. 局部变量表

  • 局部变量表是一组变量值存储空间,用于存放方法参数和方法内部定义的局部变量。Class文件在方法的Code属性的max_locals数据项中确定了该方法所需要分配的局部变量表的最大容量

  • 局部变量表的容量以变量槽(Slot)为最小单位,一个Slot可以存放一个32位以内的数据类型,对于64位的数据类型,虚拟机会以高位对齐的方式为其分配两个连续的Slot空间

  • 虚拟机通过索引定位的方式使用局部变量表,索引值的范围是从0开始至局部变量表最大的Slot数量。

  • slot可以复用

  • 如果一个局部变量定义了但没有赋初始值是不能使用的

2. 操作数栈

  • 操作数栈的最大深度也在编译的时候写入到Code属性的
    max_stacks数据项中

  • 操作数栈中元素的数据类型必须与字节码指令的序列严格匹配

  • 在大多虚拟机的实现里都会做一些优化处理,令两个栈帧出现一部分重叠。让下面栈帧的部分操作数栈与上面栈帧的部分局部变量表重叠在一起,这样在进行方法调用时就可以共用一部分数据,无须进行额外的参数复制传递

3. 动态连接

  • 每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用,持有这个引用是为了支持方法调用过程中的动态连接(Dynamic Linking)。Class文件的常量池中存有大量的符号引用,字节码中的方法调用指令就以常量池中指向方法的符号引用作为参数。

这些符号引用一部分会在类加载阶段或者第一次使用的时候就转化为直接引用,这种转化称为静态解析。另外一部分将在每一次运行期间转化为直接引用,这部分称为动态连接

4. 返回地址

  • 当一个方法开始执行后,只有两种方式可以退出这个方法:正常完成出口、异常完成出口

  • 一般来说,方法正常退出时,调用者的PC计数器的值可以作为返回地址,栈帧中很可能会保存这个计数器值。而方法异常退出时,返回地址是要通过异常处理器表来确定的,栈帧中一般不会保存这部分信息

  • 退出时可能执行的操作有:恢复上层方法的局部变量表和操作数栈,把返回值(如果有的话)压入调用者栈帧的操作数栈中,调整PC计数器的值以指向方法调用指令后面的一条指令等。

5. 附加信息

虚拟机规范允许具体的虚拟机实现增加一些规范里没有描述的信息到栈帧之中,例如与调试相关的信息,这部分信息完全取决于具体的虚拟机实现,这里不再详述。在实际开发中,一般会把动态连接、方法返回地址与其他附加信息全部归为一类,称为栈帧信息。


方法调用

方法调用阶段唯一的任务就是确定被调用方法的版本(即调用哪一个方法),暂时还不涉及方法内部的具体运行过程。

1. 解析

调用目标在程序代码写好、编译器进行编译时就必须确定下来。这类方法的调用称为解析(Resolution)

在Java虚拟机里面提供了5条方法调用字节码指令,分别如下。

  • invokestatic:调用静态方法。

  • invokespecial:调用实例构造器<init>方法、私有方法和父类方法。

  • invokevirtual:调用所有的虚方法。

  • invokeinterface:调用接口方法,会在运行时再确定一个实现此接口的对象。

  • invokedynamic:先在运行时动态解析出调用点限定符所引用的方法,然后再执行该方法,invokedynamic指令的分派逻辑是由用户所设定的引导方法决定的。

只要能被invokestatic和invokespecial指令调用的方法,都可以在解析阶段中确定唯一的调用版本,符合这个条件的有静态方法、私有方法、实例构造器、父类方法4类,它们在类加载的时候就会把符号引用解析为该方法的直接引用。这些方法可以称为非虚方法,与之相反,其他方法称为虚方法(除去final方法,虽然final方法是使用invokevirtual指令来调用的,但是由于它无法被覆盖,
没有其他版本,所以也无须对方法接收者进行多态选择,又或者说多态选择的结果肯定是唯一的。在Java语言规范中明确说明了final方法是一种非虚方法)

2. 分派

分派(Dispatch)调用则可能是静态的也可能是动态的,根据分派依据的宗量数可分为单分派和多分派。这两类分派方式的两两组合就构成了静态单分派、静态多分派、动态单分派、动态多分派4种分派组合情况

2.1. 静态分派
  • 所有依赖静态类型来定位方法执行版本的分派动作称为静态分派。静态分派的典型应用是方法重载,虚拟机载重载是是通过参数的静态类型而不是实际类型作为判定依据的。

  • 静态分派发生在编译阶段,因此确定静态分派的动作实际上不是由虚拟机来执行的。

  • 编译器虽然能确定出方法的重载版本,但在很多情况下这个重载版本并不是“唯一的”,往往只能确定一个“更加合适的”版本。

    • 自动转型:
      • 'a’按照char->int->long->float->double的顺序转型进行匹配。但不会匹配到byte和short类型的重载,因为char到byte或short的转型是不安全的
      • char接着被包装成Character,之后不会再转型成其它包装类,只能安全地转型为它实现的接口或父类,如果有多个父类,那将在继承关系中从下往上开始搜索,越接近上层的优先级越低。
      • 变长参数的重载优先级是最低的,有一些在单个参数中能成立的自动转型,如char转型为int,在变长参数中是不成立的
2.2. 动态分派

动态分派的典型应用是方法重写。

invokevirtual指令的运行时解析过程大致分为以下几个步骤:

  • 1)找到操作数栈顶的第一个元素所指向的对象的实际类型,记作C。

  • 2)如果在类型C中找到与常量中的描述符和简单名称都相符的方法,则进行访问权限校验,如果通过则返回这个方法的直接引用,查找过程结束;如果不通过,则返回
    java.lang.IllegalAccessError异常。

  • 3)否则,按照继承关系从下往上依次对C的各个父类进行第2步的搜索和验证过程。

  • 4)如果始终没有找到合适的方法,则抛出java.lang.AbstractMethodError异常。

2.3. 单分派与多分派
  • 方法的接收者与方法的参数统称为方法的宗量;单分派是根据一个宗量对目标方法进行选择,多分派则是根据多于一个宗量对目标方法进行选择。

  • Java语言的静态分派属于多分派类型;Java语言的动态分派属于单分派类型

2.4. 虚拟机动态分派的实现

最常用的“稳定优化”手段就是为类在方法区中建立一个虚方法表(Vritual Method Table,也称为vtable,与此对应的,在invokeinterface执行时也会用到接口方法表——Inteface Method Table,简称itable),使用虚方法表索引来代替元数据查找以提高性能

虚方法表中存放着各个方法的实际入口地址。如果某个方法在子类中没有被重写,那子类的虚方法表里面的地址入口和父类相同方法的地址入口是一致的,都指向父类的实现入口。如果子类中重写了这个方法,子类方法表中的地址将会替换为指向子类实现版本的入口地址

方法表一般在类加载的连接阶段进行初始化,准备了类的变量初始值后,虚拟机会把该类的方法表也初始化完毕

3. 动态类型语言支持

3.1. 动态类型语言

动态类型语言的关键特征是它的类型检查的主体过程是在运行期而不是编译期,满足这个特征的语言有很多,常用的包括:APL、Clojure、Erlang、Groovy、JavaScript、Jython、Lisp、Lua、PHP、Prolog、Python、Ruby、Smalltalk和Tcl等。相对的,在编译期就进行类型检查过程的语言(如C++和Java等)就是最常用的静态类型语言。

MethodHandle

JDK 1.7实现了JSR-292,新加入的java.lang.invoke包就是JSR-292的一个重要组成部分,这个包的主要目的是在之前单纯依靠符号引用来确定调用的目标方法这种方式以外,提供一种新的动态确定目标方法的机制,称为MethodHandle。

MethodHandle的使用方法和效果与Reflection有众多相似之处,不过,它们还是有以下这些区别:

  • Reflection和MethodHandle机制都是在模拟方法调用,但Reflection是在模拟Java代码层次的方法调用,而MethodHandle是在模拟字节码层次的方法调用

  • Reflection是重量级,而MethodHandle是轻量级。

import static java.lang.invoke.MethodHandles.lookup;
import java.lang.invoke.MethodHandle;
import java.lang.invoke.MethodType;
class Test{
    class GrandFather{
        void thinking(){
        System.out.println("i am grandfather");
    }}
    class Father extends GrandFather{
        void thinking(){
        System.out.println("i am father");
    }}
    class Son extends Father{
        void thinking(){
        //实现调用祖父类的thinking()方法,打印"i am grandfather"
            try{
                MethodType mt=MethodType.methodType(void.class);
                MethodHandle mh=lookup().findSpecial(GrandFather.class,"thinking",mt,getClass());
                mh.invoke(this);
            }catch(Throwable e){
            }
    }
    
}
public static void main(String[]args){ 
    (new Test().new Son()).thinking();
}}
invokedynamic指令

每一处含有invokedynamic指令的位置都称做“动态调用点”(Dynamic Call Site),这条指令的第一个参数不再是代表方法符号引用的CONSTANT_Methodref_info常量,而是变为JDK 1.7新加入的CONSTANT_InvokeDynamic_info常量,从这个新常量中可以得到3项信息:引导方法(Bootstrap Method,此方法存放在新增的BootstrapMethods属性中)、方法类型(MethodType)和名称。

引导方法是有固定的参数,并且返回值是java.lang.invoke.CallSite对象,这个代表真正要执行的目标方法调用。根据CONSTANT_InvokeDynamic_info常量中提供的信息,虚拟机可以找到并且执行引导方法,从而获得一个CallSite对象,最终调用要执行的目标方法。

由于invokedynamic指令所面向的使用者并非Java语言,而是其他Java虚拟机之上的动态语言,因此仅依靠Java语言的编译器Javac没有办法生成带有invokedynamic指令的字节码。

基于栈的字节码解释执行引擎

编译过程:

程序源码  ->  词法分析 ->  单词流 ->  语法分析
                                        |
解释执行<- 解释器 <- 指令流(可选)<- 抽象语法树
                                        |
目标代码 <-生成器<- 中间代码(可选)<-优化器(可选)

Javac编译器完成了程序代码经过词法分析、语法分析到抽象语法树,再遍历语法树生成线性的字节码指令流的过程。因为这一部分动作是在Java虚拟机之外进行的,而解释器在虚拟机的内部,所以Java程序的编译就是半独立的实现。

基于栈的指令集 vs 基于寄存器的指令集

  • 基于栈的指令集主要的优点就是可移植

  • 栈架构指令集的主要缺点是执行速度相对来说会稍慢一些;,栈实现在内存之中,频繁的栈访问也就意味着频繁的内存访问

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值