深入探索编译插桩技术（三、解密 JVM 字节码）(1)

最新推荐文章于 2024-07-24 08:48:18 发布

2401_84132272

最新推荐文章于 2024-07-24 08:48:18 发布

阅读量930

点赞数 20

分类专栏：程序员文章标签： jvm python 开发语言

本文链接：https://blog.csdn.net/2401_84132272/article/details/137461103

版权

程序员专栏收录该内容

173 篇文章 0 订阅

订阅专栏

CONSATNT_Integer_info {
u1 tag;
u4 bytes;
}

CONSTANT_Long_info {
u1 tag;
u4 high_bytes;
u4 low_bytes;
}

CONSTANT_Float_info {
u1 tag;
u4 bytes;
}

CONSTANT_Double_info {
u1 tag;
u4 high_bytes;
u4 low_bytes;
}

可以看到，在每一个非基本类型的常量项之中，除了其 tag 之外，最终包含的内容都是字符串。正是因为这种互相引用的模式，才能有效地节省 Class 文件的空间。（ps：利用索引来减少空间占用是一种行之有效的方式）

三、信息描述规则

对于 JVM 来说，其 采用了字符串的形式来描述数据类型、成员变量及成员函数这三类。因此，在讨论接下来各个的 Class 表项之前，我们需要了解下 JVM 中的信息描述规则。下面，我们来一一对此进行探讨。

1、数据类型

数据类型通常包含有 原始数据类型、引用类型（数组），它们的描述规则分别如下所示：

1)、原始数据类型：
Java 类型的 byte、char、double、float、int、long、short、boolean => "B"、"C"、"D"、"F"、"I"、"J"、"S"、"Z"。
2)、引用数据类型：
ClassName => L + 全路径类名（其中的 “.” 替换为 “/”，最后加分号），例如 String => Ljava/lang/String;。
3)、数组（引用类型）：
不同类型的数组 => “[该类型对应的描述名”，例如 int 数组 => "[I"，String 数组 => "[Ljava/lang/Sting;"，二维 int 数组 => "[[I"。

2、成员变量

在 JVM 规范之中，成员变量即 Field Descriptor 的描述规则如下所示：

FiledDescriptor：

1、仅包含 FieldType 一种信息

FieldType
FiledType：

2、FiledType 的可选类型

BaseType | ObjectType | ArrayType
BaseType：
B | C | D | F | I | J | S | Z
ObjectType：
L + 全路径ClassName；
ArrayType：
[ComponentType：

3、与 FiledType 的可选类型一样

ComponentType：
FiledType

在注释1处，FiledDescriptor 仅仅包含了 FieldType 一种信息；注释2处，可以看到，FiledType 的可选类型为3中：BaseType、ObjectType、ArrayType，对于每一个类型的规则描述，我们在 数据类型 这一小节已详细分析过了。而在注释3处，这里 ComponentType 是一种 JVM 规范中新定义的类型，不过它是 由 FiledType 构成，其可选类型也包含 BaseType、ObjectType、ArrayType 这三种。此外，对于字节码来讲，如果两个字段的描述符不一致，那字段重名就是合法的。

3、成员函数描述规则

在 JVM 规范之中，成员函数即 Method Descriptor 的描述规则如下所示：

MethodDescriptor:

1、括号内的是参数的数据类型描述，* 表示有 0 至多个 ParameterDescriptor，最后是返回值类型描述

( ParameterDescriptor* ) ReturnDescriptor
ParameterDescriptor:
FieldType
ReturnDescriptor:
FieldType | VoidDescriptor
VoidDescriptor:
// 2、void 的描述规则为 “V”
V

在注释1处，MethodDescriptor 由两个部分组成，括号内的是参数的数据类型描述，表示有 0 至多个 ParameterDescriptor，最后是返回值类型描述。注释2处，要注意 void 的描述规则为 “V”。例如，一个 void hello(String str) 的函数 => （Ljava/lang/String;)V。

了解了信息的描述规则之后，我们就可以来看看 Class 表中的其它重要的表项：filed_info 与 method_info。

四、filed_info 与 method_info

字段表（field_info）用于描述接口或者类中声明的变量。字段（field）包括类级变量以及实例级变量，但 不包括在方法内部声明的局部变量。

filed_info 与 method_info 数据结构的伪代码分别如下所示：

field_info {
u2 access_flags;
u2 name
u2 descriptor_index
u2 attributes_count
attribute_info attributes[attributes_count]
}

method_info {
u2 access_flags;
u2 name
u2 descriptor_index
u2 attributes_count
attribute_info attributes[attributes_count]
}

可以看到，filed_info 与 method_info 都包含有 访问标志、名字引用、描述信息、属性数量与存储属性 的数据结构。对于 method_info 所描述的成员函数来说，它的内容经过编译之后得到的 Java 字节码会保存在属性之中。

注意：类构造器为 “< clinit >” 方法，而实例构造器为 “< init >” 方法。

下面，我们就来了解下 access_flags 的相关知识。

五、access_flags

access_flag 的取值类型在 Class、Filed、Method 之中都是不同的，我们分别来看看。

1、Class 的 access_flags 取值类型

access_flags 中一共有 16 个标志位可以使用，当前只定义了其中 8 个（JDK 1.5 增加了后面 3 种），没有使用到的标志位要求一律为 0。Class 的 access_flags 取值类型如下表示：

标志名	标志值	标志含义
ACC_PUBLIC	0x0001	public类型
ACC_FINAL	0x0010	final类型
ACC_SUPER	0x0020	使用新的invokespecial语义
ACC_INTERFACE	0x0200	接口类型
ACC_ABSTRACT	0x0400	抽象类型
ACC_SYNTHETIC	0x1000	该类不由用户代码生成
ACC_ANNOTATION	0x2000	注解类型
ACC_ENUM	0x4000	枚举类型

例如一个 “public Class JsonChao” 的类所对应的 access_flags 为 0021（0X0001 和 0X0020 相结合）。下面的 Filed 与 Method 的计算也是同理。

2、Filed 的 access_flag 取值类型

接口之中的字段必须有 ACC_PUBLIC、ACC_STATIC、ACC_FINAL 标志，这些都是由 Java 本身的语言规则所决定的。Filed 的 access_flag 取值类型如下表所示：

名称	值	描述
ACC_PUBLIC	0x0001	public
ACC_PRIVATE	0x0002	private
ACC_PROTECTED	0x0004	protected
ACC_STATIC	0x0008	static
ACC_FINAL	0x0010	final
ACC_VOLATILE	0x0040	volatile
ACC_TRANSIENT	0x0080	transient，不能被序列化
ACC_SYNTHETIC	0x1000	由编译器自动生成
ACC_ENUM	0x4000	enum，字段为枚举类型

3、Method 的 access_flag 取值

Method 的 access_flag 取值如下表所示：

名称	值	描述
ACC_PUBLIC	0x0001	public
ACC_PRIVATE	0x0002	private
ACC_PROTECTED	0x0004	protected
ACC_STATIC	0x0008	static
ACC_FINAL	0x0010	final
ACC_SYNCHRONIZED	0x0020	synchronized
ACC_BRIDGE	0x0040	bridge，方法由编译器产生
ACC_VARARGS	0x0080	该方法带有变长参数
ACC_NATIVE	0x0100	native
ACC_ABSTRACT	0x0400	abstract
ACC_STRICT	0x0800	strictfp
ACC_SYNTHETIC	0x1000	方法由编译器生成

需要注意的是，当 Method 的 access_flags 的取值为 ACC_SYNTHETIC 时，该 Method 通常被称之为 合成函数。此外，当内部类访问外部类的私有成员时，在 Class 文件中也会生成一个 ACC_SYNTHETIC 修饰的函数。

六、属性

只要不与已有属性名重复，任何人实现的编译器都可以向属性表中写入自己定义的属性信息，Java 虚拟机运行时会忽略掉它所不认识的属性。

attribute_info 的数据结构伪代码如下所示：

attribute_info {
u2 attribute_name_index;
u4 attribute_length;
u1 info[attribute_length];
}

attribute_info 中的各个元素的含义如下所示：

attribute_name_index：为 CONSTANT_Utf8 类型常量项的索引，表示属性的名称。
attribute_length：属性的长度。
info：属性具体的内容。

1、attribute_name_index

attribute_name_index 所指向的 Utf8 字符串即为属性的名称，而 属性的名称是被用来区分属性的。所有的属性名称如下所示（其中下面👇 标红的为重要属性）：

1）、ConstantValue：仅出现在 filed_info 中，描述常量成员域的值，通知虚拟机自动为静态变量赋值。对于非 static 类型的变量（也就是实例变量）的赋值是在实例构造器方法中进行的;而对于类变量，则有两种方式可以选择：在类构造器方法中或者使用 ConstantValue 属性。如果变量没有被 final 修饰，或者并非基本类型及字符串，则将会选择在方法中进行初始化。
2）、Code：仅出现 method_info 中，描述函数内容，即该函数内容编译后得到的虚拟机指令，try/catch 语句对应的异常处理表等等。
3）、StackMapTable：在 JDK 1.6 发布后增加到了 Class 文件规范中，它是一个复杂的变长属性。这个属性会在虚拟机类加载的字节码验证阶段被新类型检查验证器（Type Checker）使用，目的在于代替以前比较消耗性能的基于数据流分析的类型推导验证器。它省略了在运行期通过数据流分析去确认字节码的行为逻辑合法性的步骤，而是在编译阶段将一系列的验证类型（Verification Types）直接记录在 Class 文件之中，通过检查这些验证类型代替了类型推导过程，从而大幅提升了字节码验证的性能。这个验证器在 JDK 1.6 中首次提供，并在 JDK 1.7 中强制代替原本基于类型推断的字节码验证器。StackMapTable 属性中包含零至多个栈映射帧（Stack Map Frames），其中的类型检查验证器会通过检查目标方法的局部变量和操作数栈所需要的类型来确定一段字节码指令是否符合逻辑约束。
4）、Exceptions：当函数抛出异常或错误时，method_info 将会保存此属性。
5）、InnerClasses：用于记录内部类与宿主类之间的关联。
6）、EnclosingMethod
7）、Synthetic：标识方法或字段为编译器自动生成的。
8）、Signature：JDK 1.5 中新增的属性，用于支持泛型情况下的方法签名，由于 Java 的泛型采用擦除法实现，在为了避免类型信息被擦除后导致签名混乱，需要这个属性记录泛型中的相关信息。
9）、SourceFile：包含一个指向 Utf8 常量项的索引，即 Class 对应的源码文件名。
10）、SourceDebugExtension：用于存储额外的调试信息。
11）、LineNumberTable：Java 源码的行号与字节码指令的对应关系。
12）、LocalVariableTable：局部变量数组/本地变量表，用于保存变量名，变量定义所在行。
13）、LocalVariableTypeTable：JDK 1.5 中新增的属性，它使用特征签名代替描述符，是为了引入泛型语法之后能描述泛型参数化类型而添加。
14）、Deprecated
15）、RuntimeVisibleAnnotations
16）、RuntimeInvisibleAnnotations
17）、RuntimeVisibleParameterAnnotations
18）、RuntimeInvisibleParameterAnnotations
19）、AnnotationDefault
20）、BootstrapMethods：JDK 1.7中新增的属性，用于保存 invokedynamic 指令引用的引导方法限定符。切记，类文件的属性表中最多也只能有一个 BootstrapMethods 属性。

在上述表格中，我们可以发现，不同类型的属性可能会出现在 ClassFile 中不同的成员里，当 JVM 在解析 Class 文件时会校验 Class 成员应该禁止携带有哪些类型的属性。此外，属性也可以包含子属性，例如：“Code” 属性中包含有 “LocalVariableTable”。

2、Code_attribute（🔥）

首先，要注意 并非所有的方法表都必须存在这个属性，例如接口或者抽象类中的方法就不存在 Code 属性。

Code_attribute 的数据结构伪代码如下所示：

Code_attribute {
u2 attribute_name_index;
u4 attribute_length;
u2 max_stack;
u2 max_locals;
u4 code_length;
u1 code[code_length];
u2 exception_table_length;
{
u2 start_pc;
u2 end_pc;
u2 handler_pc;
u2 catch_type;
} exception_table[exception_table_length];
u2 attributes_count;
attribute_info attributes[attributes_count];
}

Code_attribute 中的各个元素的含义如下所示：

attribute_name_index、attribute_length：attribute_length 的值为整个 Code 属性减去 attribute_name_index 和 attribute_length 的长度。
max_stack：为当前方法执行时的最大栈深度，所以 JVM 在执行方法时，线程栈的栈帧（操作数栈，operand satck）大小是可以提前知道的。每一个函数执行的时候都会分配一个操作数栈和局部变量数组，而 Code_attribure 需要包含它们，以便 JVM 在执行函数前就可以分配相应的空间。
max_locals：**为当前方法分配的局部变量个数，包括调用方式时传递的参数。long 和 double 类型计数为 2，其他为 1。max_locals 的单位是 Slot,Slot 是

虚拟机为局部变量分配内存所使用的最小单位。局部变量表中的 Slot 可以重用，当代码执行超出一个局部变量的作用域时，这个局部变量所占的 Slot 可以被其他局部变量所使用，Javac 编译器会根据变量的作用域来分配 Slot 给各个变量使用，然后计算出 max_locals 的大小**。

code_length：为方法编译后的字节码的长度。
code：用于存储字节码指令的一系列字节流。既然叫字节码指令，那么每个指令就是一个 u1 类型的单字节。一个 u1 数据类型的取值范围为 0x00~0xFF，对应十进制的 0~255，也就是一共可以表达 256 条指令。
exception_table_length：表示 exception_table 的长度。
exception_table：每个成员为一个 ExceptionHandler，并且一个函数可以包含多个 try/catch 语句，一个 try/catch 语句对应 exception_table 数组中的一项。
start_pc、end_pc：为异常处理字节码在 code[] 的索引值。当程序计数器在 [start_pc, end_pc) 内时，表示异常会被该 ExceptionHandler 捕获。
handler_pc：表示 ExceptionHandler 的起点，为 code[] 的索引值。
catch_type：为 CONSTANT_Class 类型常量项的索引，表示处理的异常类型。如果该值为 0，则该 ExceptionHandler 会在所有异常抛出时会被执行，可以用来实现 finally 代码。当 catch_type 的值为 0 时，代表任意异常情况都需要转向到 handler_pc 处进行处理。此外，编译器使用异常表而不是简单的跳转命令来实现 Java 异常及 finally 处理机制。
attributes_count 和 attributes：表示该 exception_table 拥有的 attribute 数量与数据。

在 Code_attribute 携带的属性中，"LineNumberTable" 与 "LocalVariableTable" 对我们 Android 开发者来说比较重要，所以，这里我们将再单独来讲解一下它们。

1）、LineNumberTable 属性

LineNumberTable 属性 用于 Java 的调试，可指明某条指令对应于源码哪一行。

LineNumberTable 属性的结构如下所示：

LineNumberTable_attribute {
u2 attribute_name_index;
u4 attribute_length;
u2 line_number_table_length;
{ u2 start_pc;
u2 line_number;
} line_number_table[line_number_table_length];
}

其中最重要的是 line_number_table 数组，该数组元素包含如下 两个成员变量：

1、start_pc：为 code[] 数组元素的索引，用于指向 Code_attribute 中 code 数组某处指令。
2、line_number：为 start_pc 对应源文件代码的行号。需要注意的是，多个 line_number_table 元素可以指向同一行代码，因为一行 Java 代码很可能被编译成多条指令。

2、LocalVariableTable 属性

LocalVariableTable 属性用于 描述栈帧中局部变量表中的变量与 Java 源码中定义的变量之间的关系，它也不是运行时必需的属性，但默认会生成到 Class 文件之中。

LocalVariableTable 的数据结构如下所示：

LocalVariableTable_attribute {
u2 attribute_name_index;
u4 attribute_length;
u2 local_variable_table_length;
{
u2 start_pc;
u2 length;
u2 name_index;
u2 descriptor_index;
u2 index;
} local_variable_table[local_variable_table_length];
}

其中最重要的元素是 local_variable_table 数组，其中的 start_pc 与 length 这两个参数 决定了一个局部变量在 code 数组中的有效范围。

需要注意的是，每个非 static 函数都会自动创建一个叫做 this 的本地变量，代表当前是在哪个对象上调用此函数。并且，this 对象是位于局部变量数组第1个位置（即 Slot = 0），它的作用范围是贯穿整个函数的。

此外，在 JDK 1.5 引入泛型之后，LocalVariableTable 属性增加了一个 “姐妹属性”: LocalVariableTypeTable，这个新增的属性结构与 LocalVariableTable 非常相似，仅仅是把记录的字段描述符的 descriptor_index 替换成了字段的特征签名（Signature），对于非泛型类型来说，描述符和特征签名能描述的信息是基本一致的，但是泛型引入之后，由于描述符中泛型的参数化类型被擦除掉，描述符就不能准确地描述泛型类型了，因此出现了 LocalVariableTypeTable。

Slot 是什么？

JVM 在调用一个函数的时候，会创建一个局部变量数组（即 LocalVariableTable），而 Slot 则表示当前变量在数组中的位置。

七、JVM 指令码（🔥）

在上面，我们了解了 常量池、属性、field_info、method_info 等等一系列的源码文件组成结构，它们是仅仅是一种静态的内容，这些信息并不能驱使 JVM 执行我们在源码中编写的函数。

从前可知，Code_attribute 中的 code 数组存储了一个函数源码经过编译后得到的 JVM 字节码，其中仅包含如下两种类型的信息：

1)、JVM 指令码：用于指示 JVM 执行的动作，例如加操作/减操作/new 对象。其长度为 1 个字节，所以 JVM 指令码的个数不会超过 255 个（0xFF）。
2)、JVM 指令码后的零至多个操作数：操作数可以存储在 code 数组中，也可以存储在操作数栈（Operand stack）中。

一个 Code 数组里指令和参数的组织格式 如下所示：

1字节指令码 0或多个参数（N字节，N>=0）

可以看到，Java 虚拟机的指令由一个字节长度的、代表着某种特定操作含义的数字（称为操作码，Opcode）以及跟随其后的零至多个代表此操作所需参数（称为操作数，Operands）而构成。此外，大多数的指令都不包含操作数，只有一个操作码。

字节码指令集是一种具有鲜明特点、优劣势都很突出的指令集架构，由于限制了 Java 虚拟机操作码的长度为一个字节（即 0~255），这意味着指令集的操作码总数不可能超过 256 条。

如果不考虑异常处理的话，那么 Java 虚拟机的解释器可以使用下面这个伪代码当做 最基本的执行模型 来理解，如下所示：

do {
自动计算PC寄存器的值加1;
根据PC寄存器的指示位置，从字节码流中取出操作码;
if(字节码存在操作数)从字节码流中取出操作数;
执行操作码所定义的操作;
} while (字节码流长度>0);

由于 Java 虚拟机的操作码长度只有一个字节，所以，Java 虚拟机的指令集 对于特定的操作只提供了有限的类型相关指令去支持它。例如在 JVM 中，大部分的指令都没有支持整数类型 byte、char 和 short，甚至没有任何指令支持 boolean 类型。因此，我们在处理 boolean、byte、short 和 char 类型的数组时，需要转换为与之对应的 int 类型的字节码指令来处理。

众所周知，JVM 是基于栈而非寄存器的计算模型，并且，基于栈的实现能够带来很好的跨平台特性，因为寄存器指令往往和硬件挂钩。但是，由于栈只是一个 FILO 的结构，需要频繁地压栈与出栈，因此，对于同样的操作，基于栈的实现需要更多指令才能完成。此外，由于 JVM 需要实现跨平台的特性，因此栈是在内存实现的，而寄存器则位于 CPU 的高速缓存区，因此，基于栈的实现其速度速度相比寄存器的实现要慢很多。要深入了解 JVM 的指令集，我们就必须先从 JVM 运行时的栈帧讲起。

1、运行时的栈帧

栈帧（Stack Frame）是用于支持虚拟机进行方法调用和方法执行的数据结构，它是虚拟机运行时数据区中的虚拟机栈（Virtual Machine Stack）的栈元素。

栈帧中存储了方法的 局部变量表、操作数栈、动态连接和方法返回地址、帧数据区 等信息。每一个方法从调用开始至执行完成的过程，都对应着一个栈帧在虚拟机栈里面从入栈到出栈的过程。

一个线程中的方法调用链可能会很长，很多方法都同时处于执行状态。对于 JVM 的执行引擎来说，在活动线程中，只有位于栈顶的栈帧才是有效的，称为当前栈帧（Current Stack Frame），与这个栈帧相关联的方法称为当前方法（Current Method）。执行引擎运行的所有字节码指令都只针对当前栈帧进行操作，而 栈帧的结构 如下图所示：

Java 中当一个方法被调用时会产生一个栈帧（Stack Frame）,而此方法便位于栈帧之内。而Java方法栈帧 主要包括三个部分，如下所示：

1）、局部变量区
2）、操作数栈区
3）、帧数据区（常量池引用）

帧数据区，即常量池引用在前面我们已经深入地了解过了，但是还有两个重要部分我们需要了解，一个是操作数栈，另一个则是局部变量区。通常来说，程序需要将局部变量区的元素加载到操作数栈中，计算完成之后，然后再存储回局部变量区。

查看字节码的工具

我们可以使用 jclasslib 这个字节码工具去查看字节码，使用效果如下图所示，代码编译后在菜单栏 ”View” 中选择 ”Show Bytecode With jclasslib”，可以很直观地看到当前字节码文件的类信息、常量池、方法区等信息。

下面👇，我们就先来看看操作数栈是怎么运转的。

2、操作数栈

操作数栈是为了存放计算的操作数和返回结果。在执行每一条指令前，JVM 要求该指令的操作数已经被压入到操作数栈中，并且，在执行指令时，JVM 会将指令所需的操作数弹出，并将计算结果压入操作数栈中。

对于操作数栈相关的操作指令有如下三类：

1）、直接作用于操作数据栈的指令：

dup：复制栈顶元素，常用于复制 new 指令所生成的未初始化的引用。
pop：舍弃栈顶元素，常用于舍弃调用指令的返回结果。
wap：交换栈顶的两个元素的值。

需要注意的是，当值为 long 或 double 类型时，需要占用两个栈单元，此时需要使用 dup2/pop2 指令替代 dup/pop 指令。

2）、直接将常量加载到操作数栈的指令：

对于 int（boolean、byte、char、short） 类型来说，有如下三类常用指令：

iconst：用于加载 [-1 ,5] 的 int 值。
biconst：用于加载一个字节（byte）所能代表的 int 值即 [-128-127]。
sipush：用于加载两个字节（short）所能代表的 int 值即 [-32768-32767]。

而对于 long、float、double、reference 类型来说，各个类型都仅有一类，其实就是类似于 iconst 指令，即 lconst、fconst、dconst、aconst。

3）、加载常量池中的常量值的指令：

ldc：用于加载常量池中的常量值，如 int、long、float、double、String、Class 类型的常量。例如 ldc #35 将加载常量池中的第 35 项常量值。

正常情况下，操作数栈的压入弹出都是一条条指令完成。唯一的例外是在抛异常时，JVM 会清除操作数栈的所有内容，然后将异常实例压入操作数栈中。

3、局部变量区

局部变量区一般用来 缓存计算的结果。实际上，JVM 会把局部变量区当成一个 数组，里面会依次缓存 this 指针（非静态方法）、参数、局部变量。

需要注意的是，同操作数栈一样，long 和 double 类型的值将占据两个单元，而其它的类型仅仅占据一个单元。

而对于局部变量区来说，它常用的操作指令有三种，如下所示：

1）、将局部变量区的值加载到操作数栈中

int（boolean、byte、char、short）：iload
long：lload
float：fload
double：dload
reference：aload

2）、将操作数栈中的计算结果存储在局部变量区中

int（boolean、byte、char、short）：istore
long：lstore
float：fstore
double：dstore
reference：astore

这里需要注意的是，局部变量的加载与存储指令都需要指明所加载单元的下标，例如：iload_0 就是加载普通方法局部变量区中的 this 指针。

3）、增值指令之 iinc

可以看到，上面两种类型的指令操作都需要操作局部变量区和操作数栈，那么，有没有 仅仅只作用在局部变量区的指令呢？

它就是 iinc M N（M为负整数，N为整数），它会将局部变量数组中的第 M 个单元中的 int 值增加 N，常用于 for 循环中自增量的更新，如 i++/i–。

了解了以上 JVM 的基础指令之后，我们来看一个具体的栗子🌰，代码和其对应的 JVM 指令如下所示：

public static int bar(int i) {
return ((i + 1) - 2) * 3 / 4;
}

// 对应的字节码如下：
Code:
stack=2, locals=1, args_size=1
0: iload_0
1: iconst_1
2: iadd
3: iconst_2
4: isub
5: iconst_3
6: imul
7: iconst_4
8: idiv
9: ireturn

这里我们解释下上面的几处字节码的含义，如下所示：

Code：JVM 字节码。
stack：表示该方法需要的操作数栈空间为 2。
locals：表示该方法需要的局部变量区空间为 1。
args_size：表示方法的参数大小为 1。

最后，我们来看看 每条指令执行前后局部变量区和操作数栈的变化情况，如下图所示：

了解了指令在操作数栈与局部变量区之间的转换规律，我们下面再回过头来系统地了解下以下 九类按用途分类的字节码指令。

4、字节码指令用途分类汇总

1）、加载和存储指令

加载和存储指令用于 将数据在栈帧中的局部变量表和操作数栈之间来回传输，其指令如下所示：

1）、将一个局部变量加载到操作栈：`iload、iload_、lload、lload_、fload、fload_

、dload、dload_、aload、aload_`。

2）、将一个数值从操作数栈存储到局部变量表：`istore、istore_、lstore、lstore_、

fstore、fstore_、dstore、dstore_、astore、astore_`。

3）、将一个常量加载到操作数栈：`bipush、sipush、ldc、ldc_w、ldc2_w、aconst_null、

iconst_m1、iconst_、lconst_、fconst_、dconst_`。

4）、扩充局部变量表的访问索引的指令：wide。

类似于 iload_，它代表了 iload_0、iload_1、iload_2 和 iload_3 这几条指令。这几组指令都是某个带有一个操作数的通用指令（例如iload，iload_0 的语义与操作数为 0 时的 iload 指令语义完全一致）。

2）、运算指令

运算或算术指令用于 对两个操作数栈上的值进行某种特定运算，并把结果重新存入到操作栈顶。大体上算术指令可以分为 两种：对整型数据进行运算的指令与对浮点型数据进行运算的指令。其指令如下所示：

1）、加法指令：iadd、ladd、fadd、dadd。
2）、减法指令：isub、lsub、fsub、dsub。
3）、乘法指令：imul、lmul、fmul、dmul。
4）、除法指令：idiv、ldiv、fdiv、ddiv。
5）、求余指令：irem、lrem、frem、drem。
6）、取反指令：ineg、lneg、fneg、dneg。
7）、位移指令：ishl、ishr、iushr、lshl、lshr、lushr。
8）、按位或指令：ior、lor。
9）、按位与指令：iand、land。
10）、按位异或指令：ixor、lxor。
11）、局部变量自增指令：iinc。
12）、比较指令：dcmpg、dcmpl、fcmpg、fcmpl、lcmp。

3）、类型转换指令

类型转换指令可以 将两种不同的数值类型进行相互转换，例如我们可以将小范围类型向大范围类型的安全转换，其指令如下所示：

-1）、i2b、i2c、i2s -2）、l2i -3）、f2i、f2l -4）、d2i、d2l、d2f

4）、对象创建与访问指令

其指令如下所示：

1）、创建类实例的指令：new。
2）、创建数组的指令：newarray、anewarray、multianewarray。
3）、访问类字段（static字段，或者称为类变量）和实例字段（非 static 字段，或者称为实例变量）的指令：getfield、putfield、getstatic、putstatic。
4）、把一个数组元素加载到操作数栈的指令：baload、caload、saload、iaload、laload、 faload、daload、aaload。
5）、将一个操作数栈的值存储到数组元素中的指令：bastore、castore、sastore、iastore、 fastore、dastore、aastore。
6）、取数组长度的指令：arraylength。
7）、检查类实例类型的指令：instanceof、checkcast。

5）、操作数栈管理指令

用于 直接操作操作数栈 的指令，如下所示：

1）、将操作数栈的栈顶一个或两个元素出栈：pop、pop2（用于操作 Long、Double）。
2）、复制栈顶一个或两个数值并将复制值或双份的复制值重新压入栈顶：dup、dup2、dup_x1、dup2_x1、dup_x2、dup2_x2。
3）、将栈最顶端的两个数值互换：swap。

6）、控制转移指令

控制转移指令就是 在有条件或无条件地修改 PC 寄存器的值。其指令如下所示：

1）、条件分支：ifeq、iflt、ifle、ifne、ifgt、ifge、ifnull、ifnonnull、if_icmpeq、if_icmpne、 if_icmplt、if_icmpgt、if_icmple、if_icmpge、if_acmpeq 和 if_acmpne。
2）、复合条件分支：tableswitch、lookupswitch。
3）、无条件分支：goto、goto_w、jsr、jsr_w、ret。

其中的 tableswitch 与 lookupswitch 含义如下：

tableswitch：条件跳转指令，针对密集的 case。
lookupswitch：条件跳转指令，针对稀疏的 case。

可以看到，Java 虚拟机提供的 int 类型的条件分支指令是最为丰富和强大的。

7）、方法调用指令

常用的有 5条用于方法调用的指令。如下所示：

1）、invokevirtual：用于调用对象的实例方法，根据对象的实际类型进行分派（虚方法分派），这也是 Java 语言中最常见的方法分派方式。
2）、invokeinterface：用于调用接口方法，它会在运行时搜索一个实现了这个接口方法的对象，找出适合的方法进行调用。
3）、invokespecial：用于调用一些需要特殊处理的实例方法，包括实例初始化方法、私有方法和父类方法。
4）、invokestatic：用于调用类方法（static方法）。
5）、invokedynamic：用于在运行时动态解析出调用点限定符所引用的方法，并执行该方法，前面 4 条调用指令的分派逻辑都固化在 Java 虚拟机内部，而 invokedynamic 指令的分派逻辑是由用户所设定的引导方法决定的。

这里我们需要着重注意 invokespecial 指令，它用于 调用构造器与方法，当调用方法时，会将返回值仍然压入操作数栈中，如果当前方法没有返回值则需要使用 pop 指令弹出。
自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数初中级Android工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则近万的学费，着实压力不小。自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年Android移动开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上Android开发知识点，真正体系化！

由于文件比较大，这里只是将部分目录截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且会持续更新！

如果你觉得这些内容对你有帮助，可以扫码获取！！（备注：Android）

重要知识点

下面是有几位Android行业大佬对应上方技术点整理的一些进阶资料。

高级进阶篇——高级UI，自定义View（部分展示）

UI这块知识是现今使用者最多的。当年火爆一时的Android入门培训，学会这小块知识就能随便找到不错的工作了。不过很显然现在远远不够了，拒绝无休止的CV,亲自去项目实战，读源码，研究原理吧！

面试题部分合集

《Android学习笔记总结+移动架构视频+大厂面试真题+项目实战源码》，点击传送门即可获取！

系化！**