本文通过一个简单的例子,分析jvm字节码的一些基本的概念。
例子:
public static void main(String args) {
int a=2;
int b=3;
int c = a + b;
System.out.println(c);
}
将它编译为class文件,通过javap查看字节码并输出到Test.txt里面:javap -verbose Test.class >>Test.txt
看到的是:
Classfile /F:/code/java/test/out/production/test/Test.class
Last modified Nov 18, 2018; size 544 bytes
MD5 checksum c0b35e5d4791fdaa4f540b3c11e5afc0
Compiled from "Test.java"
public class Test
minor version: 0
major version: 52
flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
#1 = Methodref #5.#23 // java/lang/Object."<init>":()V
#2 = Fieldref #24.#25 // java/lang/System.out:Ljava/io/PrintStream;
#3 = Methodref #26.#27 // java/io/PrintStream.println:(I)V
#4 = Class #28 // Test
#5 = Class #29 // java/lang/Object
#6 = Utf8 <init>
#7 = Utf8 ()V
#8 = Utf8 Code
#9 = Utf8 LineNumberTable
#10 = Utf8 LocalVariableTable
#11 = Utf8 this
#12 = Utf8 LTest;
#13 = Utf8 main
#14 = Utf8 (Ljava/lang/String;)V
#15 = Utf8 args
#16 = Utf8 Ljava/lang/String;
#17 = Utf8 a
#18 = Utf8 I
#19 = Utf8 b
#20 = Utf8 c
#21 = Utf8 SourceFile
#22 = Utf8 Test.java
#23 = NameAndType #6:#7 // "<init>":()V
#24 = Class #30 // java/lang/System
#25 = NameAndType #31:#32 // out:Ljava/io/PrintStream;
#26 = Class #33 // java/io/PrintStream
#27 = NameAndType #34:#35 // println:(I)V
#28 = Utf8 Test
#29 = Utf8 java/lang/Object
#30 = Utf8 java/lang/System
#31 = Utf8 out
#32 = Utf8 Ljava/io/PrintStream;
#33 = Utf8 java/io/PrintStream
#34 = Utf8 println
#35 = Utf8 (I)V
{
public Test();
descriptor: ()V
flags: ACC_PUBLIC
Code:
stack=1, locals=1, args_size=1
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
LineNumberTable:
line 1: 0
LocalVariableTable:
Start Length Slot Name Signature
0 5 0 this LTest;
public static void main(java.lang.String);
descriptor: (Ljava/lang/String;)V
flags: ACC_PUBLIC, ACC_STATIC
Code:
stack=2, locals=4, args_size=1
0: iconst_2
1: istore_1
2: iconst_3
3: istore_2
4: iload_1
5: iload_2
6: iadd
7: istore_3
8: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream;
11: iload_3
12: invokevirtual #3 // Method java/io/PrintStream.println:(I)V
15: return
LineNumberTable:
line 3: 0
line 4: 2
line 5: 4
line 6: 8
line 7: 15
LocalVariableTable:
Start Length Slot Name Signature
0 16 0 args Ljava/lang/String;
2 14 1 a I
4 12 2 b I
8 8 3 c I
}
SourceFile: "Test.java"
我们一步步分析这里面的内容
Classfile类文件的内容,接下去那些都是一些基本信息。
然后看Constant pool,常量池。
常量池
我们经常听说常量池,但是具体不知道是什么,这里就是常量池,在官方文档中,有一些对常量池的介绍:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-4.html#jvms-4.4
里面定义了很多类型的常量:
我们的代码里面有方法的引用:是常量1,指向常量5.常量23,这是个构造函数;
也有字段引用Fileldref,还有类的引用Class等等,稍后我们就会使用到这些常量。
接下去看到了构造函数,构造函数我们分析完了main方法来看就很容易了,所以不分析。main方法里面有个descriptor,包含了字段描述和方法描述符:
字段描述符
描述符是这个:(Ljava/lang/String;)V,这个Ljava/lang/String代表什么意思呢?看官方文档:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-4.html#jvms-4.3.3。看到这里又一个表:
L代表一个对象的引用。那么B代表byte,C代表char,I代表Integer等,还有数组是用[代表等等,后面我们还会看到。
方法描述符
刚刚:(Ljava/lang/String;)V这里我们知道了Ljava/lang/String代表了String对象的引用,剩下的看方法描述符的官网:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-4.html#jvms-4.3.3。
我们可以知道V代表了void也就是返回空值。
接下去的flags也不需要解释了,就是public和static。
code代码
接下去就是我们的code代码,首先我们要知道,我们的jvm的代码是基于栈的,不像x86系统基于寄存器的。
Code:
stack=2, locals=4, args_size=1
0: iconst_2
1: istore_1
2: iconst_3
3: istore_2
4: iload_1
5: iload_2
6: iadd
7: istore_3
8: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream;
11: iload_3
12: invokevirtual #3 // Method java/io/PrintStream.println:(I)V
15: return
第一行的stack就是栈的深度2,locals就是本地变量表(下面还有讲解),本地变量表的最大长度(slot为单位),64位是2,其他是1,它的索引从0开始,如果是非static方法,索引0就代表this,后面是入参,再后面是本地变量。args_size=1代表了参数有一个。
一行行解释。如果有字节码指令看不懂,参考官方文档:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-6.html
- iconst_2就是把常量2压入栈,i是integer类型,const就是常量。此时栈元素个数为1,本地变量表元素个数为1(因为有一个入参args)
- istore_1,就是把栈的元素放到本地变量表。此时栈元素个数为0,本地变量表元素个数为2。int a=2;这句代码执行完毕。
- iconst_3,把常量3压入栈。此时栈元素个数为1,本地变量表元素个数为2.
- istore_2,把栈的元素放到本地变量表。此时栈元素个数为0,本地变量表元素个数为3。int b=3;这句代码执行完毕。
- iload_1,把本地表量表索引为1的数压入栈里面。此时栈元素个数为1,本地表量表元素个数为3.
- iload_2,把本地表量表索引为2的数压入栈里面。此时栈元素个数为2,本地标量表元素个数为3.
- iadd,把栈里面的两个元素出栈之后并相加,把相加的数放回到栈里面。此时栈元素个数为1,值为5,本地表量表元素个数为3.
- istore_3,把栈里面的元素放到本地变量表的索引为3的位置。此时栈元素个数为0,本地表量元素个数为4。此时代码int c=a+b执行完毕。
- getstatic #2,把常量池里面第二个元素读取出来,这是一个静态filed:java/lang/System.out:Ljava/io/PrintStream;然后把这个filed放到栈里面。此时栈元素个数为1,值就是放进去的filedref,本地表量元素个数为4。
- iload_3,把本地变量表里面索引为3的元素放到栈里面。此时栈元素个数为2,一个是filedref,一个是值5,本地表量元素个数为4,分别为args,2,3,5。
- invokevirtual #3 执行常量池里面3号方法:java/io/PrintStream.println:(I)V。此时栈被清空,元素个数为0,本地变量表的个数为4。这个代码System.out.println©;执行完毕。
- return 清空本地表量表并返回。此时栈元素格式为0,本地变量表元素个数为0。方法返回。
LineNumberTable
官方文档:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-4.html#jvms-4.7.12
没什么好说吧,就是代码的第3行对应了我们编译出来代码的第0行,代码的第4行对应了编译出来代码的第2行,以此类推。这里也是比较清晰的。
LocalVariableTable
这个就是我们听说很多次的本地变量表:
Start Length Slot Name Signature
0 16 0 args Ljava/lang/String;
2 14 1 a I
4 12 2 b I
8 8 3 c I
官方文档:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-2.html#jvms-2.6.1。
通过code的分析,我们知道本地标量表有4个变量,所以有4行,有4个slot。由于是64位系统,每个slot大小是2,里面的元素签名分别是string(传进去的参数)、Integer、Integer、Integer。
这段代码就简单的分析完毕,以后我们会更加深入分析别的一些情形。