jvm字节码指令

最新推荐文章于 2023-03-10 06:00:00 发布

尼獔

最新推荐文章于 2023-03-10 06:00:00 发布

阅读量227

点赞数

分类专栏： jvm 笔记文章标签： java

本文链接：https://blog.csdn.net/test1_12/article/details/120698102

版权

笔记同时被 2 个专栏收录

20 篇文章 0 订阅

订阅专栏

jvm

6 篇文章 0 订阅

订阅专栏

1.基本概述

Java字节码对于虚拟机，就好像汇编语言对于计算机，属于基本执行指令。
Java 虚拟机的指令由一个字节长度的、代表着某种特定操作含义的数字(称为操作码，Opcode)以及跟随其后的零至多个代表此操作所需参数(称为操作数，Operands)而构成。由于 Java虚拟机采用面向操作数栈而不是寄存器的结构，所以大多数的指令都不包含操作数，只有一个操作码。
由于限制了Java 虚拟机操作码的长度为一个字节(即0～255)，这意味着指令集的操作码总数不可能超过256 条。

           字节码与数据类型在Java虚拟机的指令集中，大多数的指令都包含了其操作所对应的数据类型信息。例如，iload指令用于从局部变量表中加载int型的数据到操作数栈中，而fload指令加载的则是float类型的数据。对于大部分与数据类型相关的字节码指令，它们的操作码助记符中都有特殊的字符来表明专门为哪种数据类型服务： i代表对int类型的数据操作，
                1代表long
                s代表short
                b代表byte
                c代表char
                f代表float
                d代表double
        也有一些指令的助记符中没有明确地指明操作类型的字母，如arraylength指令，它没有代表数据类型的特殊字符，但操作数永远只能是一个数组类型的对象。
还有另外一些指令，如无条件跳转指令goto则是与数据类型无关的。
       大部分的指令都没有支持整数类型byte、char和short，甚至没有任何指令支持boolean类型。编译器会在编译期或运行期将byte和short类型的数据带符号扩展(Sign-Extend)为相应的int类型数据，将boolean和char类型数据零位扩展(Zero-Extend)为相应的int类型数据。与之类似，在处理boolean、byte、short和char类型的数组时，也会转换为使用对应的int类型的字节码指令来处理。因此，大多数对于boolean、byte、short和char类型数据的操作。

2.分类

   字节码指令集按用途大致分成9类。
        •加载与存储指令
        •算术指令
        • 类型转换指令
        •对象的创建与访问指令
        •方法调用与返回指令
        •操作数栈管理指令
        •控制转移指令
        •异常处理指令
        •同步控制指令

2.1加载和存储指令

     1、作用
           加载和存储指令用于将数据从栈帧的局部变量表和操作数栈之间来回传递。
    2、常用指令
       1、【局部变量压栈指令】
          局部变量压栈指令将给定的局部变量表中的数据压入操作数栈。
          这类指令大体可以分为：
                > xload_<n>(x为i、1、f、d、a，n为0到3)
                > xload (x为i、1、f、d、a)r
                说明：在这里，x的取值表示数据类型。指令xload_n表示将第n个局部变量压入操作数栈，比如iload_1、fload_0、aload_9等指令。其中aload_n表示将一个对象引用压栈。指令xload通过指定参数的形式，把局部变量压入操作数栈，当使用这个命令时，表示局部变量的数量可能超过了4个，比如指令iload、fload等。

    public void add(int num,long num2,double num3){
        System.out.println(num);
        System.out.println(num2);
        System.out.println(num3);

    }

对应字节码指令：
 0 getstatic #2 <java/lang/System.out : Ljava/io/PrintStream;>
 3 iload_1
 4 invokevirtual #3 <java/io/PrintStream.println : (I)V>
 7 getstatic #2 <java/lang/System.out : Ljava/io/PrintStream;>
10 lload_2
11 invokevirtual #4 <java/io/PrintStream.println : (J)V>
14 getstatic #2 <java/lang/System.out : Ljava/io/PrintStream;>
17 dload 4
19 invokevirtual #5 <java/io/PrintStream.println : (D)V>
22 return

2、【常量入栈指令】

              常量入栈指令的功能是将常数压入操作数栈，根据数据类型和入栈内容的不同，又可以分为const系列、push系列和ldc指令。
             指令const系列：用于对特定的常量入栈，入栈的常量隐含在指令本身里。指令有：iconst_<i>(i从-1到5)、lconst_<1>(1从0到1)、fconst_<f>(f从0到2)、dconst_<d>(d从0到1)、aconst_null。
比如，
iconst_m1将-1压入操作数栈；
iconst_x(x为0到5)将x压入栈：
lconst_0、lconst_1分别将长整数0和1压入栈；
fconst_0、fconst_1、fconst_2分别将浮点数0、1、2压入栈;
dconst_0和dconst_1分别将double型0和1压入栈。
aconst_null将null压入操作数栈；
从指令的命名上不难找出规律，指令助记符的第一个字符总是喜欢表示数据类型，i表示整数，1表示长整数，f表示浮点数，d表示双精度浮点，习惯上用a表示对象引用。如果指令隐含操作的参数，会以下划线形式给出。
           指令push系列：主要包括bipush和sipush。它们的区别在于接收数据类型的不同，bipush接收8位整数作为参数，sipush接收16位整数，它们都将参数压入栈。
           指令ldc系列：如果以上指令都不能满足需求，那么可以使用万能的ldc指令，它可以接收一个8位的参数，该参数指向常量池中的int、float或者String的索引，将指定的内容压入堆栈。

如果是long或者时double使用ldc2_w

    public void add2(){
        int a = -1;
        int b =  2;
        int p =  5;
        int u =  6;
        int f =  127;
        int c =  128;
        int d =  232232323;
    }
        对应的字节码指令：
         0 iconst_m1
         1 istore_1
         2 iconst_2
         3 istore_2
         4 iconst_5
         5 istore_3
         6 bipush 6
         8 istore 4
        10 bipush 127
        12 istore 5
        14 sipush 128
        17 istore 6
        19 ldc #6 <232232323>
        21 istore 7
        23 return

           3、【出栈装入局部变量表指令】出栈装入局部变量表指令用于将操作数栈中栈顶元素弹出后，装入局部变量表的指定位置，用于给局部变量赋值。
        这类指令主要以store的形式存在，比如xstore(x为i、1、f、d、a)、xstore_n (x为i、1、f、d、a，n为日至3)。
·其中，指令istore_n将从操作数栈中弹出一个整数，并把它赋值给局部变量索引n位置。
·指令xstore由于没有隐含参数信息，故需要提供一个byte类型的参数类指定目标局部变量表的位置。
       说明：一般说来，类似像store这样的命令需要带一个参数，用来指明将弹出的元素放在局部变量表的第几个位置。但是，为了尽可能压缩指令大小，使用专门的istore 1指令表示将弹出的元素放置在局部变量表第1个位置。类似的还有
istore_0、istore_2、istore_3，它们分别表示从操作数栈顶弹出一个元素，存放在局部变量表第0、2、3个位置。
        由于局部变量表前几个位置总是非常常用，因此这种做法虽然增加了指令数量，但是可以大大压缩生成的字节码的体积。如果局部变量表很大，需要存储的槽位大于3，那么可以使用istore指令，外加一个参数，用来表示需要存放的槽位位置。
           4、扩充局部变量表的访问索引的指令：wide。
上面所列举的指令助记符中，有一部分是以尖括号结尾的(例如iload_<n>)。这些指令助记符实际上代表了一组指令(例如 iload <n>代表了iload 0、iload 1、iload 2和iload 3这几个指令)。这几组指令都是某个带有一个操作数的通用指令(例如 iload)的特殊形式，对于这若干组特殊指令来说，它们表面上没有操作数，不需要进行取操作数的动作，但操作数都隐含在指令中。
除此之外，它们的语义与原生的通用指令完全一致(例如 iload 的语义与操作数为0时的iload 指令语义完全一致)。在尖括号之间的字母指定了指令隐含操作数的数据类型，<n>代表非负的整数，<i>代表是int类型数据，<1>代表long类型，<f>代表float类型，<d>代表double类型。

2.2算术指令

所有的算术指令包括：
加法指令：iadd、ladd、fadd、dadd
减法指令：isub、lsub、fsub、dsub
乘法指令：imul、mul、 fmul、dmul
除法指令：idiv、ldiv、fdiv、ddiv
求余指令：irem、lrem、frem、drem //remainder:余数
取反指令：ineg、lneg、fneg、dneg //negation:取反
自增指令：iinc
位运算指令，又可分为：
· 位移指令：ishl、ishr、iushr、lshl、lshr、lushr
·按位或指令：ior、lor
• 按位与指令：iand、land
• 按位异或指令：ixor、lxor
比较指令：dcmpg、dcmpl、fcmpg、fcmpl、lcmp

比较指令的说明
比较指令的作用是比较栈顶两个此素的大小，并将比较结果入栈。
比较指令有：dcmpg，dcmpl、fcmpg、fcmpl、lcmp。与前面讲解的指令类似，首字符d表示double类型，f表示float，1表示long。
对于double和float类型的数字，由于NaN的存在，各有两个版本的比较指令。以float为例，有fcmpg和fcmp1两个令，它们的区别在于在数字比较时，若遇到NaN值，处理结果不同。
指令dcmp1和dcmpg也是类似的，根据其命名可以推测其含义，在此不再赘述。
指令1cmp针对long型整数，由于1ong型整数没有NaN值，故无需准备两套指令。
举例：
指令fcmpg和fcmpl都从栈中弹出两个操作数，并将它们做比较，设栈顶的元素为v2，栈顶顺位第2位的元素为v1，若v1=v2，则压入0；若v1>v2则压入1；若v1<v2则压入-1。
两个指令的不同之处在于，如果遇到NaN值，fcmpg会压入1，而fcmp1会压入-1。

2.3类型转换指令

2.3.1.宽化类型转换

宽化类型转换(Widening Numeric Conversions)
1.转换规则：
          Java虚拟机直接支持以下数值的宽化类型转换(widening numeric conversion，小范围类型向大范围类型的安全转换)。也就是说，并不需要指令执行，包括：
·从int类型到long、float或者double类型。对应的指令为：i21、i2f、i2d
从long类型到float、double类型。对应的指令为：12f、12d
从float类型到double类型。对应的指令为：f2d
     简化为：int --> long --> float --> double
2.精度损失问题
         2.1 宽化类型转换是不会因为超过目标类型最大值而丢失信息的，例如，从int转换到1ong，或者从int转换到double，都不会丢失任何信息，转换前后的值是精确相等的。
          2.2 从int、long类型数值转换到float，或者long类型数值转换到double时，将可能发生精度丢失——可能丢失掉几个最低有效位上的值，转换后的浮点数值是根据IEEE754最接近舍入模式所得到的正确整数值。
尽管宽化类型转换实际上是可能发生精度丢失的，但是这种转换永远不会导致Java虚拟机抛出运行时异常。

3.补充说明
从byte、char和short类型到int类型的宽化类型转换实际上是不存在的。对于byte类型转为int,虚拟机并没有做实质性的转化处理，只是简单地通过操作数栈交换了两个数据。而将byte转为long时，使用的是121，可以看到在内部byte在这里已经等同于int类型处理，类似的还有short类型，这种处理方式有两个特点：一方面可以减少实际的数据类型，如果为short和byte都准备一套指令，那么指令的数量就会大增，而虚拟机目前的设计上，只愿意使用一个字节表示指令，因此指令总数不能超过256个，为了节省指令资源，将short和byte当做int处理也在情理之中。
另一方面，由于局部变量表中的槽位固定为32位，无论是byte或者short存入局部变量表，都会占用32位空间。从这个角度说，也没有必要特意区分这几种数据类型。

3.3.2.窄化类型转化

            1.转换规则Java虚拟机也直接支持以下窄化类型转换：
                .从int类型至byte、short或者char类型。对应的指令有：i2b、i2c、i2s
                从long类型到int类型。对应的指令有：l2i
                从float类型到int或者long类型。对应的指令有：f2l、f2l
                从double类型到int、long或者float类型。对应的指令有：d2i、d2l、d2f
          2. 精度损失问题
            窄化类型转换可能会导致转换结果具备不同的正负号、不同的数量级，因此，转换过程很可能会导致数值丢失精度。尽管数据类型窄化转换可能会发生上限溢出、下限溢出和精度丢失等情况，但是Java虚拟机规范中明确规定数值类型的窄化转换指令永远不可能导致虚拟机抛出运行时异常

        3.补充说明
                3.1 当将一个浮点值窄化转换为整数类型T(T限于int或1ong类型之一)的时候，将遵循以下转换规则：.如果浮点值是NaN，那转换结果就是int或1ong类型的9。
如果浮点值不是无穷大的话，浮点值使用IEEE754的向零舍入模式取整，获得整数值v，如果v在目标类型T(int或long)的表示范围之内，那转换结果就是v。否则，将根据v的符号，转换为T所能表示的最大或者最小正数
                3.2 当将一个 double 类型窄化转换为float 类型时，将遵循以下转换规则：
通过向最接近数舍入模式舍入一个可以使用float类型表示的数字。最后结果根据下面这3条规则判断：.如果转换结果的绝对值太小而无法使用float来表示，将返回 float类型的正负零。
如果转换结果的绝对值太大而无法使用float来表示，将返回float类型的正负无穷大。
对于double 类型的 NaN值将按规定转换为float类型的 NaN值。

2.4.对象的创建与访问指令

    2.4.1创建类实例的指令：new
        它接收一个操作数，为指向常量池的索引，表示要创建的类型，执行完成后，将对象的引用压入栈。
         创建数组的指令：
         newarray：创建基本类型数组
     anewarray：创建引用类型数组
         multianewarray：创建多维数组
        上述创建指令可以用于创建对象或者数组，由于对象和数组在Java中的广泛使用，这些指令的使用频率也非常高。

2.4.2.字段访问指令
对象创建后，就可以通过对象访问指令获取对象实例或数组实例中的字段或者数组元素。
访问类字段(static字段，或者称为类变量)的指令：getstatic、putstatic访问类实例字段(非static字段，或者称为实例变量)的指令：getfield、putfield

2.4.3.数组操作指令
数组操作指令主要有：xastore和xaload指令。具体为：
·把一个数组元素加载到操作数栈的指令：blpload、caload、saload、iaload、laload、faload、daload、aaload
• 将一个操作数栈的值存储到数组元素中的指令：bastore、 castore、 sastore、iastore、lastore、fastore、dastore、aastore

2.4.4.类型检查指令
检查类实例或数组类型的指令：instanceof、checkcast。
指令checkcast用于检查类型强制转换是否可以进行。如果可以进行，那么checkcast指令不会改变操作数栈，否则它会抛出ClassCastException异常。
指令instanceof用来判断给定对象是否是某一个类的实例，它会将判断结果压入操作数栈。

2.5 方法调用与返回指令

        2.5.1.方法调用指令：invokevirtual、invokeinterface、invokespecial、invokestatic、invokedynamic
        以下5条指令用于方法调用：
         invokevirtual指令用于调用对象的实例方法，根据对象的实际类型进行分派(虚方法分派)，支持多态。这也是Java语言中最常见的方法分派方式。
        invokeinterface指令用于调用接口方法，它会在运行时搜索由特定对象所实现的这个接口方法，并找出适合的方法进行调用。
        invokespecial指令用于调用一些需要特殊处理的实例方法，包括实例初始化方法(构造器)、私有方法和父类方法。这些方法都是静态类型绑定的，不会在调用时进行动态派发。
        invokestatic指令用于调用命名类中的类方法(static方法)。这是静态绑定的。
        invokedynamic：调用动态绑定的方法，这个是JDK 1.7后新加入的指令。用于在运行时动态解析出调用点限定符所引用的方法，并执行该方法。前面4条调用指令的分派逻辑都固化在java 虚拟机内部，而invokedynamic指令的分派逻辑是由用户所设定的引导方法决定的。

2.5.2.方法返回指令：
方法调用结束前，需要进行返回。方法返回指令是根据返回值的类型区分的。
包括ireturn(当返回值是boolean、byte、char、short和int 类型时使用)、lreturn、freturn、
dreturn和areturn另外还有一条return 指令供声明为void的方法、实例初始化方法以及类和接口的类初始化方法使用。

举例：通过ireturn指令，将当前函数操作数栈的顶层元素弹出，并将这个元素压入调用者函数的操作数栈中(因为调用者非常关心函数的返回值)，所有在当前函数操作数栈中的其他元素都会被丢弃。如果当前返回的是synchronized方法，那么还会执行一个隐含的monitorexit指令，退出临界区。

2.6操作数栈管理指令

     如同操作一个普通数据结构中的堆栈那样，JVM提供的操作数栈管理指令，可以用于直接操作操作数栈的指令。
        这类指令包括如下内容：
        将一个或两个元素从栈顶弹出，并且直接废弃：pop，pop2；
        复制栈顶一个或两个数值并将复制值或双份的复制值重新压入栈顶：dup，dup2，dup_x1，dup2_x1，dup_x2，dup2_x2;
        将栈最顶端的两个Slot数值位置交换：swap。Java虚拟机没有提供交换两个64位数据类型(long、double)数值的指令。
      指令nop，是一个非常特殊的指令，它的字节码为Ox00。和汇编语言中的nop一样，它表示什么都不做。这条指令一般可用于调试、占位等。这些指令属于通用型，对栈的压入或者弹出无需指明数据类型。

说明：
不带_x的指令是复制栈顶数据并压入栈顶。包括两个指令，dup和dup2。dup的系数代表要复制的Slot个数。 dup开头的指令用于复制1个Slot的数据。例如1个int或1个reference类型数据dup2开头的指令用于复制2个Slot的数据。例如1个1ong，或2个int，或1个int+1个float类型数据带_x的指令是复制栈顶数据并插入栈顶以下的某个位置。共有4个指令，dup_x1，dup2_x1，dup_x2,dup2_x2。对于带_x的复制插入指令，只要将指令的dup和x的系数相加，结果即为需要插入的位置。因此
dup_x1插入位置：1+1=2，即栈顶2个Slot下面
dup x2插入位置：1+2=3，即栈顶3个Slot下面
dup2_x1插入位置：2+1=3，即栈顶3个Slot下面
dup2_×2插入位置：2+2=4，即栈顶4个Slot下面
pop:将栈顶的1个Slot数值出栈。例如1个short类型数值
pop2：将栈顶的2个Slot数值出栈。例如1个double类型数值，或者2个int类型数值

2.7控制转移指令

    2.7.1.条件跳转指令
        条件跳转指令通常和比较指令结合使用。在条件跳转指令执行前，一般可以先用比较指令进行栈顶元素的准备，然后进行条件跳转。
        条件跳转指令有：ifed.iflt, ifle, ifne, ifgt, ifge, ifnull,ifnonnull。这些指令都接收两个字节的操作数，用于计算跳转的位置(16位符号整数作为当前位置的offset)。
它们的统一含义为：弹出栈顶元素，测试它是否满足某一条件，如果满足条件，则跳转到给定位置。

注意：
1.与前面运算规则一致：
•对于boolean、byte、Ichar、short类型的条件分支比较操作，都是使用int类型的比较指令完成
.对于long、float、double类型的条件分支比较操作，则会先执行相应类型的比较运算指令，运算指令会返回一个整型值到操作数栈中，随后再执行int类型的条件分支比较操作来完成整个分支跳转.
2.由于各类型的比较最终都会转为int 类型的比较操作，所以Java虚拟机提供的int类型的条件分支指令是最为丰富和强大的。

2.7.2.比较条件跳转指令
比较条件跳转指令类似于比较指令和条件跳转指令的结合体，它将比较和跳转两个步骤合二为一。
这类指令有：if icmpeq、if icmpne、if icmplt、if icmpgt、if icmple、if icmpge、if acmpeq和if acmpne。其中指令助记符加上“if_”后，以字符“i”开头的指令针对int型整数操作(也包括short和byte类型)，以字符“a”开头的指令表示对象引用的比较。

注意：
    1.与前面运算规则一致：
        对于boolean、byte、char、short类型的条件分支比较操作，都是使用int类型的比较指令完成
        对于long、float、double类型的条件分支比较操作，则会先执行相应类型的比较运算指令，运算指令会返回一个整型值到操作数栈中，随后再执行int类型的条件分支比较操作来完成整个分支跳转
2. 由于各类型的比较最终都会转为int 类型的比较操作，所以Java虚拟机提供的int类型的条件分支指令是最为丰富和强大的。

2.7.3.多条件分支跳转指令

多条件分支跳转指令专门是为了switch-case语句设计的，主要有tablesswitch(用于case值是连续的)和lookupswitch(case值是不连续的).

2.7.4无条件跳转指令
目前主要的无条件跳转指令为goto。指令goto接收两个字节的操作数，共同组成一个带符号的整数，用于指定指令的偏移量指令执行的目的就是跳转到偏移量给定的位置处。
如果指令偏移量太大，超过双字节的带符号整数的范围，则可以使用指令goto_w，它和goto有相同的作用，但是它接收4个字节的操作数，可以表示更大的地址范围。
指令jsr、jsr_w、ret虽然也是无条件跳转的，但主要用于try-finally语句，且已经被虚拟机逐渐废弃，故不在这里介绍这两个指令。

2.8异常处理指令

异常对象生成throw(手动/自动) 指令：athrow

异常对象的处理,抓抛模型。try-catch-finally :使用异常表。

                1、处理异常:
        在Java虚拟机中，处理异常(catch语句)不是由字节码指令来实现的(早期使用jsr、ret指令)，而是采用异常表来完成的。
    2、异常表
                如果一个方法定义了一个try-catch 或者try-finally的异常处理，就会创建一个异常表。它包含了每个异常处理或者finally块的信息。异常表保存了每个异常处理信息。比如：
起始位置，结束位置，程序计数器记录的代码处理的偏移地址，被捕获的异常类在常量池中的索引.
            当一个异常被抛出时，JVM会在当前的方法里寻找一个匹配的处理，如果没有找到，这个方法会强制结束并弹出当前栈帧，并且异常会重新抛给上层调用的方法(在调用方法栈帧)。如果在所有栈帧弹出前仍然没有找到合适的异常处理，这个线程将终止。如果这个异常在最后一个非守护线程里抛出，将会导致JVM自己终止，比如这个线程是个main线程。
不管什么时候抛出异常，如果异常处理最终匹配了所有异常类型，代码就会继续执行。在这种情况下，如果方法结束后没有抛出异常，仍然执行finally块，在return前，它直接跳到finally块来完成目标

2.9同步控制指令

        1-方法级的同步
        方法级的同步：是隐式的I即无须通过字节码指令来控制，它实现在方法调用和返回操作之中。虚拟机可以从方法常量池的方法表结构中的 ACC_SYNCHRONIZED 访问标志得知一个方法是否声明为同步方法；
当调用方法时，调用指令将会检查方法的ACC_SYNCHRONIZED访问标志是否设置。如果设置了，执行线程将先持有同步锁，然后执行方法。最后在方法完成(无论是正常完成还是非正常完成)时释放同步锁。
          在方法执行期间，执行线程持有了同步锁，其他任何线程都无法再获得同一个锁。
如果一个同步方法执行期间抛出了异常，并且在方法内部无法处理此异常，那这个同步方法所持有的锁将在异常抛到同步方法之外时自动释放。

2-方法内指定指令序列的同步
同步一段指令集序列：通常是由java中的synchronized语句块来表示的。jvm的指令集有monitorenter 和monitorexit 两条指令来支持 synchronized关键字的语义。
当一个线程进入同步代码块时，它使用monitorenter指令请求进入。如果当前对象的监视器计数器为0,则它会被准许进入，若为1，则判断持有当前监视器的线程是否为自己，如果是，则进入，否则进行等待，直到对象的监视器计数器为0，才会被允许进入同步块。
当线程退出同步块时，需要使用monitorexit声明退出。在Java虚拟机中，任何对象都有一个监视器与之相关联，用来判断对象是否被锁定，当监视器被持有后，对象处于锁定状态。
指令monitorenter和monitorexit在执行时，都需要在操作数栈顶压入对象，之后monitorenter和monitorexit的锁定和释放都是针对这个对象的监视器进行的。