JVM学习笔记1 字节码篇

最新推荐文章于 2024-09-05 14:00:47 发布

呆浆糊

最新推荐文章于 2024-09-05 14:00:47 发布

阅读量1.2k

点赞数 16

文章标签： jvm 学习笔记 java

本文链接：https://blog.csdn.net/qq_33953507/article/details/141890287

版权

文章目录

一、JVM概述
- 1.如何理解JVM跨平台语言?
- 2.JVM的架构与知识脉络图
二、字节码文件概述
三、Class文件结构细节
四、字节码指令集与解析概述
- 1.字节码与数据类型
- 1.指令分类
五、字节码指令集与解析概述

一、JVM概述

1.如何理解JVM跨平台语言?

在这里插入图片描述 Java虚拟机根本不关心运行在其内部的程序到底是使用何种编程语言编写的，它只关心“字节码”文件

2.JVM的架构与知识脉络图

在这里插入图片描述
还有个详细点的

这个架构可以分成三层看：
最上层：javac编译器将编译好的字节码class文件，通过java 类装载器执行机制，把对象或class文件存放在 jvm划分内存区域。
中间层：称为Runtime Data Area，主要是在Java代码运行时用于存放数据的，从左至右为方法区(永久代、元数据区)、堆(共享,GC回收对象区域)、栈、程序计数器、寄存器、本地方法栈(私有)。
最下层：解释器、JIT(just in time)编译器和 GC（Garbage Collection，垃圾回收器）

二、字节码文件概述

1.class文件里是什么？

源代码经过编译器编译之后便会生成一个字节码文件，字节码是一种二进制的类文件，它的内容是JVM的指令，而不像C、C++经由编译器直接生成机器码。

2.哪些类型对应有Class的对象？

(1）class：外部类，成员(成员内部类，静态内部类)，局部内部类，匿名内部类
（2）interface：接口
（3）[]：数组
（4）enum：枚举
（5）annotation：注解@interface
（6）primitive type：基本数据类型
（7）void

@Test
public void test()
{
    Class c1 = Object.class;
    Class c2 = Comparable.class;
    Class c3 = String[].class;
    Class c4 = int[][].class;
    Class c5 = ElementType.class;
    Class c6 = Override.class;
    Class c7 = int.class;
    Class c8 = void.class;
    Class c9 = Class.class;
 
    int[] a = new int[10];
    int[] b = new int[100];
    Class c10 = a.getClass();
    Class c11 = b.getClass();
    // 只要元素类型与维度一样，就是同一个Class
    System.out.println(c10 == c11);
}

3.字节码指令是什么以及为什么要了解字节码指令

什么是字节码指令？
Java虚拟机的指令由一个字节长度的、代表着某种特定操作含义的操作码（opcode）以及跟随其后的零至多个代表此操作所需参数的操作数（operand）所构成。虚拟机中许多指令并不包含操作数，只有一个操作码。

为什么要懂字节码指令？
比如这些代码如果不懂字节码指令是不是就有些无从下手

public class ByteCodeInterview {
    //面试题： i++和++i有什么区别？
    @Test
    public void test1(){
        int i = 10;
        i++;
        //++i;

        System.out.println(i);
    }

    @Test
    public void test2(){
        int i = 10;
        i = i++;
        System.out.println(i);
    }

    @Test
    public void test3(){
        int i = 2;
        i *= i++;
        System.out.println(i);
    }

    @Test
    public void test4(){
        int k = 10;
        k = k + (k++) + (++k);
        System.out.println(k);
    }

    //包装类对象的缓存问题
    @Test
    public void test5(){
//        Integer x = 5;
//        int y = 5;

        Integer i1 = 10;
        Integer i2 = 10;
        System.out.println(i1 == i2);

        Integer i3 = 128;
        Integer i4 = 128;
        System.out.println(i3 == i4);

        Boolean b1 = true;
        Boolean b2 = true;
        System.out.println(b1 == b2);
    }
}

三、Class文件结构细节

注：这章节比较枯燥不想看就跳过吧
这张图方便下面的理解
在这里插入图片描述

1.class文件结构细节概述

面试题
文件结构有几个部分？（百度）

Class文件的结构并不是一成不变的，随着Java虚拟机的不断发展，总是不可避免地会对Class文件结构做出一些调整，但是其基本结构和框架是非常稳定的。

Class文件的总体结构如下：

魔数
Class文件版本
常量池
访问标识(或标志)
类索引，父类索引，接口索引集合
字段表集合
方法表集合
属性表集合

class文件的结构
上图是官网上的
在这里插入图片描述这是一张Java字节码总的结构表，如果有需要按照上面的顺序逐一进行解读就可以了。(了解就行一般也不会直接去看)

2.class文件的魔数是什么？

每个 Class 文件开头的4个字节的无符号整数称为魔数（Magic Number）
它的唯一作用是确定这个文件是否为一个能被虚拟机接受的有效合法的Class文件。即：魔数是Class文件的标识符。
魔数值固定为0xCAFEBABE。不会改变就像windos的可执行文件 PE格式都已4D5A开头
使用魔数而不是扩展名来进行识别主要是基于安全方面的考虑，因为文件扩展名可以随意地改动。

3.如何确保高版本的JVM可执行低版本的class文件？

不同版本的Java编译器编译的Class文件对应的版本是不一样的。目前，高版本的Java虚拟机可以执行由低版本编译器生成的Class文件,但是低版本的Java虚拟机不能执行由高版本编译器生成的Class文件。否则JVM会抛出java.lang.UnsupportedClassVersionError异常。（向下兼容）
在实际应用中，由于开发环境和生产环境的不同，可能会导致该问题的发生。因此，需要我们在开发时，特别注意开发编译的JDK版本和生产环境中的JDK版本是否一致。
紧接着魔数的 4 个字节存储的是 Class 文件的版本号。同样也是4个字节。第5个和第6个字节所代表的含义就是编译的副版本号minor_version，而第7个和第8个字节就是编译的主版本号major_version。
它们共同构成了class文件的格式版本号。譬如某个 Class 文件的主版本号为 M，副版本号为 m，那么这个Class 文件的格式版本号就确定为 M.m。
版本号和Java编译器的对应关系如下表：

结合这张图来看 34H 对应 52 也就是JDK1.8

4.常量池：class文件的基石？作用是？

常量池：存放所有常量

常量池是Class文件中内容最为丰富的区域之一。常量池对于Class文件中的字段和方法解析也有着至关重要的作用。
常量池：可以理解为Class文件之中的资源仓库，它是Class文件结构中与其他项目关联最多的数据类型（后面的很多数据类型都会指向此处），也是占用Class文件空间最大的数据项目之一。
常量池表项中，用于存放编译时期生成的各种字面量和符号引用，这部分内容将在类加载后进入方法区的运行时常量池中存放。

1-为什么需要常量池计数器？

constant_pool_count （常量池计数器）

由于常量池的数量不固定，时长时短，所以需要放置两个字节来表示常量池容量计数值。
常量池容量计数值（u2类型）：从1开始，表示常量池中有多少项常量。即constant_pool_count=1表示常量池中有0个常量项。

int[] arr = new int[10];
arr[0];
arr[1];
ar[10 - 1];

2-常量池表

2.1-字面量和符号引用

在对这些常量解读前，我们需要搞清楚几个概念。
常量池主要存放两大类常量：字面量（Literal）和符号引用（Symbolic References）。如下表：
在这里插入图片描述

2.1.1-全限定名

com/pest/test/Demo这个就是类的全限定名，仅仅是把包名的".“替换成”/"，为了使连续的多个全限定名之间不产生混淆，在使用时最后一般会加入一个“;”表示全限定名结束。

2.1.2-简单名称

简单名称是指没有类型和参数修饰的方法或者字段名称

2.1.3-描述符

描述符的作用是用来描述字段的数据类型、方法的参数列表（包括数量、类型以及顺序）和返回值。根据描述符规则，基本数据类型（byte、char、double、float、int、long、short、boolean）以及代表无返回值的void类型都用一个大写字符来表示，而对象类型则用字符L加对象的全限定名来表示，详见下表: （数据类型：基本数据类型、引用数据类型）
在这里插入图片描述
用描述符来描述方法时，按照先参数列表，后返回值的顺序描述，参数列表按照参数的严格顺序放在一组小括号“()”之内。如：
方法java.lang.String toString()的描述符为() Ljava/lang/String;，
方法int abc(int[] x, int y)的描述符为([II) I。

PS:谈谈对符号引用、直接引用的理解

Java代码在进行Javac编译的时候，并不像C和C++那样有“链接”这一步骤，而是在虚拟机加载Class文件的时候进行动态链接。也就是说，**在Class文件中不会保存各个方法、字段的最终内存布局信息，因此这些字段、方法的符号引用不经过运行期转换的话无法得到真正的内存入口地址，也就无法直接被虚拟机使用。**当虚拟机运行时，需要从常量池获得对应的符号引用，再在类创建时或运行时解析、翻译到具体的内存地址之中。

虚拟机在加载Class文件时才会进行动态链接，也就是说，Class文件中不会保存各个方法和字段的最终内存布局信息，因此，这些字段和方法的符号引用不经过转换是无法直接被虚拟机使用的。当虚拟机运行时，需要从常量池中获得对应的符号引用，再在类加载过程中的解析阶段将其替换为直接引用，并翻译到具体的内存地址中。
这里说明下符号引用和直接引用的区别与关联：

符号引用：符号引用以一组符号来描述所引用的目标，符号可以是任何形式的字面量，只要使用时能无歧义地定位到目标即可。符号引用与虚拟机实现的内存布局无关，引用的目标并不一定已经加载到了内存中。
直接引用：直接引用可以是直接指向目标的指针、相对偏移量或是一个能间接定位到目标的句柄。直接引用是与虚拟机实现的内存布局相关的，同一个符号引用在不同虚拟机实例上翻译出来的直接引用一般不会相同。如果有了直接引用，那说明引用的目标必定已经存在于内存之中了。

2.1-字面量和符号引用

常量池中每一项常量都是一个表，JDK1.7之后共有14种不同的表结构数据。如下表格所示
在这里插入图片描述

根据上图每个类型的描述我们也可以知道每个类型是用来描述常量池中哪些内容（主要是字面量、符号引用）的。比如：CONSTANT_Integer_info是用来描述常量池中字面量信息的，而且只是整型字面量信息。
标志为15、16、18的常量项类型是用来支持动态语言调用的（jdk1.7时才加入的）。

细节说明：

CONSTANT_Class_info 结构用于表示类或接口
CONSTANT_Fieldref_info、CONSTANT_Methodref_info和CONSTANT_InterfaceMethodref_info结构表示字段、方法和接口方法
CONSTANT_String_info结构用于表示String类型的常量对象
CONSTANT_Integer_info和CONSTANT_Float_info 表示4字节（int和float）的数值常量
CONSTANT_Long_info和CONSTANT_Double_info结构表示8字节(long和double)的数值常量
在class文件的常量池表中，所有的8字节常量均占两个表成员（项）的空间。如果一个CONSTANT_Long_info或CONSTANT_Double_info结构的项在常量池表中的索引位n，则常量池表中下一个可用项的索引位n+2，此时常量池表中索引为n+1的项仍然有效但必须视为不可用的。
CONSTANT_NameAndType_info结构用于表示字段或方法，但是和之前的3个结构不同，CONSTANT_NameAndType_info结构没有指明该字段或方法所属的类或接口。
CONSTANT_Utf8_info用于表示字符常量的值
CONSTANT_MethodHandle_info结构用于表示方法句柄
CONSTANT_MethodType_info结构表示方法类型
CONSTANT_InvokeDynamic_info结构用于表示invokedynamic指令所用到的引导方法(bootstrap method)、引导方法所用到的动态调用名称(dynamic invocation name)、参数和返回类型，并可以给引导方法传入一系列称为静态参数(static argument)的常量。

5.访问标识

访问标识(access_flag、访问标志、访问标记)

在常量池后，紧跟着访问标记。该标记使用两个字节表示，用于识别一些类或者接口层次的访问信息，包括：这个 Class 是类还是接口；是否定义为 public 类型；是否定义为 abstract 类型；如果是类的话，是否被声明为 final 等。各种访问标记如下所示
类的访问权限通常为 ACC_ 开头的常量。
每一种类型的表示都是通过设置访问标记的32位中的特定位来实现的。比如，若是public final的类，则该标记为ACC_PUBLIC | ACC_FINAL。
使用ACC_SUPER可以让类更准确地定位到父类的方法super.method(),现代编译器都会设置并且使用这个标记。

补充说明：

带有ACC_INTERFACE标志的class文件表示的是接口而不是类，反之则表示的是类而不是接口。
1）如果一个class文件被设置了 ACC_INTERFACE 标志，那么同时也得设置ACC_ABSTRACT 标志。同时它不能再设置 ACC_FINAL、ACC_SUPER 或 ACC_ENUM 标志。
2）如果没有设置ACC_INTERFACE标志，那么这个class文件可以具有上表中除 ACC_ANNOTATION外的其他所有标志。当然，ACC_FINAL和ACC_ABSTRACT这类互斥的标志除外。这两个标志不得同时设置。
ACC_SUPER标志用于确定类或接口里面的invokespecial指令使用的是哪一种执行语义。针对Java虚拟机指令集的编译器都应当设置这个标志。对于JavaSE 8及后续版本来说，无论class文件中这个标志的实际值是什么，也不管class文件的版本号是多少，Java虚拟机都认为每个class文件均设置了ACC_SUPER标志。
1）ACC_SUPER标志是为了向后兼容由旧Java编译器所编译的代码而设计的。目前的 ACC_SUPER标志在由JDK 1.0.2之前的编译器所生成的access_flags中是没有确定含义的，如果设置了该标志，那么Oracle的Java虚拟机实现会将其忽略。
ACC_SYNTHETIC标志意味着该类或接口是由编译器生成的，而不是由源代码生成的
注解类型必须设置ACC_ANNOTATION标志。如果设置了 ACC_ANNOTATION标志，那么也必须设置ACC_INTERFACE标志。
ACC_ENUM标志表明该类或其父类为枚举类型
表中没有使用的access_flags标志是为未来扩充而预留的，这些预留的标志在编译器中应该设置为0, Java虚拟机实现也应该忽略它们。

6.类索引、父类索引、接口索引集合

在访问标记后，会指定该类的类别、父类类别以及实现的接口，格式如下：
在这里插入图片描述
这三项数据来确定这个类的继承关系。

类索引用于确定这个类的全限定名
父类索引用于确定这个类的父类的全限定名。由于 Java语言不允许多重继承，所以父类索引只有一个，除了java.lang.Object 之外，所有的Java类都有父类，因此除了java.lang.Object 外，所有Java类的父类索引都不为 0。
接口索引集合就用来描述这个类实现了哪些接口，这些被实现的接口将按 implements 语句（如果这个类本身是一个接口，则应当是 extends 语句）后的接口顺序从左到右排列在接口索引集合中。

this_class（类索引）
双字节无符号整数，指向常量池的索引。它提供了类的全限定名,如com/pest/java1/Demo。this_class的值必须是对常量池表中某项的一个有效索引值。常量池在这个索引处的成员必须为CONSTANT_Class_info类型结构体，该结构体表示这个class文件所定义的类或接口。
super_class （父类索引）
双字节无符号整数，指向常量池的索引。它提供了当前类的父类的全限定名。如果我们没有继承任何类，其默认继承的是java/lang/Object类。同时，由于Java不支持多继承，所以其父类只有一个。
superclass指向的父类不能是final。

7.字段表集合

暂略

8.方法表集合

暂略

9.属性表集合

暂略

10.小结

在这里插入图片描述

四、字节码指令集与解析概述

1.字节码与数据类型

在Java虚拟机的指令集中，大多数的指令都包含了其操作所对应的数据类型信息。例如，iload指令用于从局部变量表中加载int型的数据到操作数栈中，而fload指令加载的则是float类型的数据。

对于大部分与数据类型相关的字节码指令，它们的操作码助记符中都有特殊的字符来表明专门为哪种数据类型服务：

i代表对int类型的数据操作
l代表long类型的数据操作
s代表short类型的数据操作
b代表byte类型的数据操作
c代表char类型的数据操作
f代表float类型的数据操作
d代表double类型的数据操作

也有一些指令的助记符中没有明确地指明操作类型的字母，如arraylength指令，它没有代表数据类型的特殊字符，但操作数永远只能是一个数组类型的对象。

还有另外一些指令，如无条件跳转指令goto则是与数据类型无关的。

**大部分的指令都没有支持整数类型byte、char和short，甚至没有任何指令支持boolean类型。**编译器会在编译期或运行期将byte和short类型的数据带符号扩展（Sign-Extend）为相应的int类型数据，将boolean和char类型数据零位扩展（Zero-Extend）为相应的int类型数据。与之类似，在处理boolean、byte、short和char类型的数组时，也会转换为使用对应的int类型的字节码指令来处理。因此，大多数对于boolean、byte、short和char类型数据的操作，实际上都是使用相应的int类型作为运算类型。

1.指令分类

为了快速学习 JVM中的字节码指令集按用途大致分成 9 类。

加载与存储指令
算术指令
类型转换指令
对象的创建与访问指令
方法调用与返回指令
操作数栈管理指令
控制转移指令
异常处理指令
同步控制指令

五、字节码指令集与解析概述

5.1-加载与存储指令

作用
加载和存储指令用于将数据从栈帧的局部变量表和操作数栈之间来回传递
常用指令
1、【局部变量压栈指令】将一个局部变量加载到操作数栈：xload、xload_（其中x为i、l、f、d、a，n 为 0 到 3）
【常量入栈指令】将一个常量加载到操作数栈：bipush、sipush、ldc、ldc_w、ldc2_w、aconst_null、iconst_m1、iconst_、lconst_、fconst_、dconst_
【出栈装入局部变量表指令】将一个数值从操作数栈存储到局部变量表：xstore、xstore_（其中x为i、l、f、d、a，n 为 0 到 3）
扩充局部变量表的访问索引的指令：wide。

上面所列举的指令助记符中，有一部分是以尖括号结尾的（例如iload_）。这些指令助记符实际上代表了一组指令（例如 iload_代表了iload_0、iload_1、iload_2和iload_3这几个指令）。这几组指令都是某个带有一个操作数的通用指令（例如 iload）的特殊形式，对于这若干组特殊指令来说，它们表面上没有操作数，不需要进行取操作数的动作，但操作数都隐含在指令中。

5.1.1-局部变量压栈指令

局部变量压栈指令将给定的局部变量表中的数据压入操作数栈。
这类指令大体可以分为：
> xload_ (x为i、l、f、d、a，n为 0 到 3)
> xload (x为i、l、f、d、a)
说明：在这里，x的取值表示数据类型。

指令xload_n表示将第n个局部变量压入操作数栈，比如iload_1、fload_0、aload_0等指令。其中aload_n表示将一个对象引用压栈。
指令xload通过指定参数的形式，把局部变量压入操作数栈，当使用这个命令时，表示局部变量的数量可能超过了4个，比如指令iload、fload等。

5.1.2-局部变量压栈指令

常量入栈指令的功能是将常数压入操作数栈，根据数据类型和入栈内容的不同，又可以分为const系列、push系列和ldc指令。

指令const系列：用于对特定的常量入栈，入栈的常量隐含在指令本身里。指令有：iconst_ (i从-1到5)、lconst_ (l从0到1)、fconst_ (f从0到2)、dconst_ (d从0到1)、aconst_null。
比如，

iconst_m1将-1压入操作数栈；
iconst_x（x为0到5）将x压入栈：
lconst_0、lconst_1分别将长整数0和1压入栈；
fconst_0、fconst_1、fconst_2分别将浮点数0、1、2压入栈；
dconst_0和dconst_1分别将double型0和1压入栈。
aconst_null将null压入操作数栈；
从指令的命名上不难找出规律，指令助记符的第一个字符总是喜欢表示数据类型，i表示整数，l表示长整数，f表示浮点数，d表示双精度浮点，习惯上用a表示对象引用。如果指令隐含操作的参数，会以下划线形式给出。
int i = 3; iconst_3 int j = 6;
iconst 6? bipush 6?
int k = 32768 ldc ?

指令push系列：主要包括bipush和sipush。它们的区别在于接收数据类型的不同，bipush接收8位整数作为参数，sipush接收16位整数，它们都将参数压入栈。

指令ldc系列：如果以上指令都不能满足需求，那么可以使用万能的ldc指令，它可以接收一个8位的参数，该参数指向常量池中的int、float或者String的索引，将指定的内容压入堆栈。
类似的还有ldc_w，它接收两个8位参数，能支持的索引范围大于ldc。
如果要压入的元素是long或者double类型的,则使用ldc2_w指令，使用方式都是类似的。
在这里插入图片描述

5.1.3-出栈装入局部变量表指令

   出栈装入局部变量表指令用于将操作数栈中栈顶元素弹岀后，装入局部变量表的指定位置，用于给局部变量赋值。

这类指令主要以store的形式存在，比如xstore （x为i、l、f、d、a）、 xstore_n （x 为 i、l、f、d、a, n 为 0 至 3）。

其中，指令istore_n将从操作数栈中弹出一个整数，并把它赋值给局部变量索引n位置。\
指令xstore由于没有隐含参数信息，故需要提供一个byte类型的参数类指定目标局部变量表的位置。

说明：
一般说来，类似像store这样的命令需要带一个参数，用来指明将弹出的元素放在局部变量表的第几个位置。但是，为了尽可能压缩指令大小，使用专门的istore_1指令表示将弹出的元素放置在局部变量表第1个位置。类似的还有istore_0、istore_2、istore_3,它们分别表示从操作数栈顶弹出一个元素，存放在局部变量表第0、2、3个位置。

由于局部变量表前几个位置总是非常常用，因此这种做法虽然增加了指令数量，但是可以大大压缩生成的字节码的体积。如果局部变量表很大，需要存储的槽位大于3,那么可以使用istore指令，外加一个参数，用来表示需要存放的槽位位置。

5.2-算术指令

作用:
算术指令用于对两个操作数栈上的值进行某种特定运算，并把结果重新压入操作数栈。

分类
大体上算术指令可以分为两种：对整型数据进行运算的指令与对浮点类型数据进行运算的指令。

byte、short、char和boolean类型说明
在每一大类中，都有针对Java虚拟机具体数据类型的专用算术指令。但没有直接支持byte、short、char和boolean类型的算术指令，对于这些数据的运算，都使用int类型的指令来处理。此外，在处理boolean、byte、short和char类型的数组时，也会转换为使用对应的int类型的字节码指令来处理。
在这里插入图片描述
运算时的溢出
数据运算可能会导致溢出，例如两个很大的正整数相加，结果可能是一个负数。其实Java虚拟机规范并无明确规定过整型数据溢出的具体结果，仅规定了在处理整型数据时，只有除法指令以及求余指令中当出现除数为0时会导致虚拟机抛出异常ArithmeticException。

运算模式
向最接近数舍入模式：JVM要求在进行浮点数计算时，所有的运算结果都必须舍入到适当的精度，非精确结果必须舍入为可被表示的最接近的精确值，如果有两种可表示的形式与该值一样接近，将优先选择最低有效位为零的；
向零舍入模式：将浮点数转换为整数时，采用该模式，该模式将在目标数值类型中选择一个最接近但是不大于原值的数字作为最精确的舍入结果；

NaN值使用
当一个操作产生溢出时，将会使用有符号的无穷大表示，如果某个操作结果没有明确的数学定义的话，将会使用 NaN值来表示。而且所有使用NaN值作为操作数的算术操作，结果都会返回 NaN；

在这里插入图片描述

比较指令的说明

比较指令的作用是比较栈顶两个元素的大小，并将比较结果入栈。
比较指令有：dcmpg, dcmpl、fcmpg、fcmpl、lcmp。
与前面讲解的指令类似，首字符d表示double类型，f表示float,l表示long。
对于double和float类型的数字，由于NaN的存在，各有两个版本的比较指令。以float为例，有fcmpg和fcmpl两个指令，它们的区别在于在数字比较时，若遇到NaN值，处理结果不同。
指令dcmpl和dcmpg也是类似的，根据其命名可以推测其含义，在此不再赘述。
指令lcmp针对long型整数，由于long型整数没有NaN值，故无需准备两套指令。

举例：
指令fcmpg和fcmpl都从栈中弹出两个操作数，并将它们做比较，设栈顶的元素为v2,栈顶顺位第2位的元素为v1,若v1=v2,则压入0；若v1>v2则压入1；若v1<v2则压入-1。
两个指令的不同之处在于，如果遇到NaN值，fcmpg会压入1,而fcmpl会压入-1。

数值类型的数据，才可以谈大小！（byte\short\char\int；long\float\double)
boolean、引用数据类型不能比较大小

5.3-类型转换指令

1、类型转换指令说明
① 类型转换指令可以将两种不同的数值类型进行相互转换。
② 这些转换操作一般用于实现用户代码中的显式类型转换操作，或者用来处理字节码指令集中数据类型相关指令无法与数据类型一一对应的问题。

5.3.1-宽化类型转换

宽化类型转换（Widening Numeric Conversions）

转换规则：
Java虚拟机直接支持以下数值的宽化类型转换（widening numeric conversion，小范围类型向大范围类型的安全转换）。也就是说，并不需要指令执行，包括：
从int类型到long、float或者double类型。对应的指令为：i2l、i2f、i2d
从long类型到float、double类型。对应的指令为：l2f、l2d
从float类型到double类型。对应的指令为：f2d
简化为：int --> long --> float --> double
精度损失问题
2.1 宽化类型转换是不会因为超过目标类型最大值而丢失信息的，例如，从int转换到 long，或者从int转换到double，都不会丢失任何信息，转换前后的值是精确相等的。
2.2 从int、long类型数值转换到float，或者long类型数值转换到double时，将可能发生精度丢失——可能丢失掉几个最低有效位上的值，转换后的浮点数值是根据IEEE754最接近舍入模式所得到的正确整数值。
尽管宽化类型转换实际上是可能发生精度丢失的，但是这种转换永远不会导致Java虚拟机抛出运行时异常。
补充说明
**从byte、char和short类型到int类型的宽化类型转换实际上是不存在的。**对于byte类型转为int,虚拟机并没有做实质性的转化处理，只是简单地通过操作数栈交换了两个数据。而将byte转为long时，使用的是i2l,可以看到在内部byte在这里已经等同于int类型处理，类似的还有short类型，这种处理方式有两个特点：
一方面可以减少实际的数据类型，如果为short和byte都准备一套指令，那么指令的数量就会大增，而虚拟机目前的设计上，只愿意使用一个字节表示指令，因此指令总数不能超过256个，为了节省指令资源，将short和byte当做int处理也在情理之中。
另一方面，由于局部变量表中的槽位固定为32位，无论是byte或者short存入局部变量表，都会占用32位空间。从这个角度说，也没有必要特意区分这几种数据类型。

5.3.2-窄化类型转换

窄化类型转换（Narrowing Numeric Conversion）

转换规则
Java虚拟机也直接支持以下窄化类型转换：
从int类型至byte、short或者char类型。对应的指令有：i2b、i2s、i2c
从long类型到int类型。对应的指令有：l2i
从float类型到int或者long类型。对应的指令有：f2i、f2l
从double类型到int、long或者float类型。对应的指令有：d2i、d2l、d2f
精度损失问题
窄化类型转换可能会导致转换结果具备不同的正负号、不同的数量级，因此，转换过程很可能会导致数值丢失精度。
尽管数据类型窄化转换可能会发生上限溢出、下限溢出和精度丢失等情况，但是Java虚拟机规范中明确规定数值类型的窄化转换指令永远不可能导致虚拟机抛出运行时异常
补充说明
3.1 当将一个浮点值窄化转换为整数类型T（T限于int或long类型之一）的时候，将遵循以下转换规则：
如果浮点值是NaN，那转换结果就是int或long类型的0。
如果浮点值不是无穷大的话，浮点值使用IEEE 754的向零舍入模式取整，获得整数值v，如果v在目标类型T（int或long）的表示范围之内，那转换结果就是v。否则，将根据v的符号，转换为T所能表示的最大或者最小正数
3.2 当将一个 double 类型窄化转换为 float 类型时，将遵循以下转换规则：
通过向最接近数舍入模式舍入一个可以使用float类型表示的数字。最后结果根据下面这3条规则判断：
如果转换结果的绝对值太小而无法使用 float来表示，将返回 float类型的正负零。
如果转换结果的绝对值太大而无法使用 float来表示，将返回 float类型的正负无穷大。
对于double 类型的 NaN值将按规定转换为 float类型的 NaN值。

5.4-对象的创建与访问指令

Java是面向对象的程序设计语言，虚拟机平台从字节码层面就对面向对象做了深层次的支持。有一系列指令专门用于对象操作，可进一步细分为创建指令、字段访问指令、数组操作指令、类型检查指令。

5.4.1-创建指令

虽然类实例和数组都是对象，但Java虚拟机对类实例和数组的创建与操作使用了不同的字节码指令：

创建类实例的指令：
创建类实例的指令：new
它接收一个操作数，为指向常量池的索引，表示要创建的类型，执行完成后，将对象的引用压入栈。
创建数组的指令：
创建数组的指令：newarray、anewarray、multianewarray。
newarray：创建基本类型数组
anewarray：创建引用类型数组
multianewarray：创建多维数组

上述创建指令可以用于创建对象或者数组，由于对象和数组在Java中的广泛使用，这些指令的使用频率也非常高。

5.4.2-字段访问指令

对象创建后，就可以通过对象访问指令获取对象实例或数组实例中的字段或者数组元素。

访问类字段（static字段，或者称为类变量）的指令：getstatic、putstatic
访问类实例字段（非static字段，或者称为实例变量）的指令：getfield、putfield

5.4.3-数组操作指令

数组操作指令主要有：xastore和xaload指令。具体为：

把一个数组元素加载到操作数栈的指令：baload、caload、saload、iaload、laload、faload、daload、aaload
将一个操作数栈的值存储到数组元素中的指令：bastore、 castore、 sastore、iastore、 lastore、fastore、dastore、aastore

在这里插入图片描述

取数组长度的指令：arraylength
该指令弹出栈顶的数组元素，获取数组的长度，将长度压入栈。
说明
指令xaload表示将数组的元素压栈，比如saload、caload分别表示压入short数组和char数组。指令xaload在执行时，要求操作数中栈顶元素为数组索引i,栈顶顺位第2个元素为数组引用a,该指令会弹岀栈顶这两个元素，并将a[i]重新压入栈。
xastore则专门针对数组操作，以iastore为例，它用于给一个int数组的给定索引赋值。在iastore执行前，操作数栈顶需要以此准备3个元素：值、索引、数组引用，iastore会弹出这3个值，并将值赋给数组中指定索引的位置。

5.4.4-类型检查指令

检查类实例或数组类型的指令：instanceof、checkcast。

指令checkcast用于检查类型强制转换是否可以进行。如果可以进行，那么checkcast指令不会改变操作数栈，否则它会抛出ClassCastException异常。
指令instanceof用来判断给定对象是否是某一个类的实例，它会将判断结果压入操作数栈。

5.5-对象的创建与访问指令

5.5.1-方法调用指令

invokevirtual、invokeinterface、invokespecial、invokestatic 、invokedynamic
以下5条指令用于方法调用：

invokevirtual指令用于调用对象的实例方法，根据对象的实际类型进行分派（虚方法分派），支持多态。这也是Java语言中最常见的方法分派方式。
invokeinterface指令用于调用接口方法，它会在运行时搜索由特定对象所实现的这个接口方法，并找出适合的方法进行调用。
invokespecial指令用于调用一些需要特殊处理的实例方法，包括实例初始化方法（构造器）、私有方法和父类方法。这些方法都是静态类型绑定的，不会在调用时进行动态派发。
invokestatic指令用于调用命名类中的类方法（static方法）。这是静态绑定的。
invokedynamic：调用动态绑定的方法，这个是JDK 1.7后新加入的指令。用于在运行时动态解析出调用点限定符所引用的方法，并执行该方法。前面4条调用指令的分派逻辑都固化在 java 虚拟机内部，而 invokedynamic指令的分派逻辑是由用户所设定的引导方法决定的。

5.5.2-方法返回指令

方法调用结束前，需要进行返回。方法返回指令是根据返回值的类型区分的。

包括ireturn（当返回值是 boolean、byte、char、short和int类型时使用）、lreturn、freturn、dreturn和areturn
另外还有一条return 指令供声明为 void的方法、实例初始化方法以及类和接口的类初始化方法使用。

在这里插入图片描述

5.6-操作数栈管理指令

如同操作一个普通数据结构中的堆栈那样，JVM提供的操作数栈管理指令，可以用于直接操作操作数栈的指令。

这类指令包括如下内容：

将一个或两个元素从栈顶弹出，并且直接废弃： pop，pop2；
复制栈顶一个或两个数值并将复制值或双份的复制值重新压入栈顶： dup, dup2, dup_x1, dup2_x1, dup_x2, dup2_x2；
将栈最顶端的两个Slot数值位置交换： swap。Java虚拟机没有提供交换两个64位数据类型（long、double）数值的指令。
指令nop,是一个非常特殊的指令，它的字节码为0x00。和汇编语言中的nop一样，它表示什么都不做。这条指令一般可用于调试、占位等。

这些指令属于通用型，对栈的压入或者弹出无需指明数据类型。

说明：
不带_x的指令是复制栈顶数据并压入栈顶。包括两个指令，dup和dup2。dup的系数代表要复制的Slot个数。
dup开头的指令用于复制1个Slot的数据。例如1个int或1个reference类型数据
dup2开头的指令用于复制2个Slot的数据。例如1个long，或2个int，或1个int+1个float类型数据
带_x的指令是复制栈顶数据并插入栈顶以下的某个位置。共有4个指令,dup_x1, dup2_x1, dup_x2, dup2_x2。对于带_x的复制插入指令，只要将指令的dup和x的系数相加，结果即为需要插入的位置。因此

dup_x1插入位置：1+1=2，即栈顶2个Slot下面
dup_x2插入位置：1+2=3，即栈顶3个Slot下面
dup2_x1插入位置：2+1=3，即栈顶3个Slot下面
dup2_x2插入位置：2+2=4，即栈顶4个Slot下面
pop：将栈顶的1个Slot数值出栈。例如1个short类型数值
pop2：将栈顶的2个Slot数值出栈。例如1个double类型数值，或者2个int类型数值

5.7-控制转移指令

5.7.1-条件跳转指令

条件跳转指令通常和比较指令结合使用。在条件跳转指令执行前，一般可以先用比较指令进行栈顶元素的准备，然后进行条件跳转。
条件跳转指令有： ifeq, iflt, ifle, ifne, ifgt, ifge, ifnull, ifnonnull。这些指令都接收两个字节的操作数，用于计算跳转的位置(16位符号整数作为当前位置的offset)。
它们的统一含义为：弹出栈顶元素，测试它是否满足某一条件，如果满足条件，则跳转到给定位置。

在这里插入图片描述

注意：

与前面运算规则一致：
对于boolean、byte、char、short类型的条件分支比较操作，都是使用int类型的比较指令完成
对于long、float、double类型的条件分支比较操作，则会先执行相应类型的比较运算指令，运算指令会返回一个整型值到操作数栈中，随后再执行int类型的条件分支比较操作来完成整个分支跳转
由于各类型的比较最终都会转为 int 类型的比较操作，所以Java虚拟机提供的int类型的条件分支指令是最为丰富和强大

5.7.2-比较条件跳转指令

比较条件跳转指令类似于比较指令和条件跳转指令的结合体，它将比较和跳转两个步骤合二为一。
这类指令有：**if_icmpeq、if_icmpne、if_icmplt、if_icmpgt、if_icmple、if_icmpge、if_acmpeq和if_acmpne。**其中指令助记符加上“if_”后，以字符“i”开头的指令针对int型整数操作(也包括short和byte类型)，以字符“a”开头的指令表示对象引用的比较。
在这里插入图片描述
这些指令都接收两个字节的操作数作为参数，用于计算跳转的位置。同时在执行指令时，栈顶需要准备两个元素进行比较。指令执行完成后，栈顶的这两个元素被清空，且没有任何数据入栈。如果预设条件成立，则执行跳转，否则，继续执行下一条语句。

5.7.3-多条件分支跳转

略

5.7.4-无条件跳转

略

5.8-类型转换指令

5.8.1-抛出异常指令

(1)athrow指令

在Java程序中显示抛出异常的操作（throw语句）都是由athrow指令来实现。
除了使用throw语句显示抛出异常情况之外，JVM规范还规定了许多运行时异常会在其他Java虚拟机指令检测到异常状况时自动抛出。例如，在之前介绍的整数运算时，当除数为零时，虚拟机会在
idiv或 ldiv指令中抛出 ArithmeticException异常。

(2)注意

正常情况下，操作数栈的压入弹出都是一条条指令完成的。唯一的例外情况是在抛异常时，Java
虚拟机会清除操作数栈上的所有内容，而后将异常实例压入调用者操作数栈上。

##############
异常及异常的处理：
过程一：异常对象的生成过程 —> throw (手动 / 自动) —> 指令：athrow
过程二：异常的处理：抓抛模型。 try-catch-finally —> 使用异常表

5.8.2-异常处理与异常表

1、处理异常：

在Java虚拟机中，处理异常（catch语句）不是由字节码指令来实现的（早期使用jsr、ret指令），而是采用异常表来完成的。

2、异常表

如果一个方法定义了一个try-catch
或者try-finally的异常处理，就会创建一个异常表。它包含了每个异常处理或者finally块的信息。异常表保存了每个异常处理信息。比如：起始位置结束位置程序计数器记录的代码处理的偏移地址被捕获的异常类在常量池中的索引

当一个异常被抛出时，JVM会在当前的方法里寻找一个匹配的处理，如果没有找到，这个方法会强制结束并弹出当前栈帧，并且异常会重新抛给上层调用的方法(在调用方法栈帧)。如果在所有栈帧弹出前仍然没有找到合适的异常处理，这个线程将终止。如果这个异常在最后一个非守护线程里抛出，将会导致JVM自己终止，比如这个线程是个main线程。

不管什么时候抛出异常，如果异常处理最终匹配了所有异常类型，代码就会继续执行。在这种情况下，如果方法结束后没有抛出异常，仍然执行finally块，在return前，它直接跳到finally块来完成目标

5.9-同步控制指令

暂略

呆浆糊

关注

16
点赞
踩
25

收藏

觉得还不错? 一键收藏
0
评论
JVM学习笔记1 字节码篇

Java虚拟机根本不关心运行在其内部的程序到底是使用何种编程语言编写的，它只关心“字节码”文件源代码经过编译器编译之后便会生成一个字节码文件，字节码是一种二进制的类文件，它的内容是JVM的指令，而不像C、C++经由编译器直接生成机器码。面试题文件结构有几个部分？（百度）Class文件的结构并不是一成不变的，随着Java虚拟机的不断发展，总是不可避免地会对Class文件结构做出一些调整，但是其基本结构和框架是非常稳定的。魔数Class文件版本常量池访问标识(或标志)
复制链接

扫一扫