转自:http://www.blogjava.net/DLevin/archive/2011/09/13/358497.html
小注:去年在看《深入解析JVM》书的时候做的一些记录,同时参考了《Java虚拟机规范》。只是对指令的一些列举,加入了一些自己的理解。可以用来查询。
Java二进制指令代码解析
Java源码在运行之前都要编译成为字节码格式(如.class文件),然后由ClassLoader将字节码载入运行。在字节码文件中,指令代码只是其中的一部分,里面还记录了字节码文件的编译版本、常量池、访问权限、所有成员变量和成员方法等信息(详见Java字节码格式详解)。本文主要简单介绍不同Java指令的功能以及在代码中如何解析二进制指令。
Java指令是基于栈的体系结构,大部分的指令默认的操作数在栈中。映像中ARM是基于寄存器的操作指令,而x86好像是混合寄存器和存储器的,发现基于栈的操作指令确实简单,学起来很快。不过不知道这种操作的效率怎么样,以我自己的推测应该是不太好的。对这方面不太了解,随便扯几句。
Java总共有200多条指令,不过很多都是重复的。我的理解,网络是Java一个非常重要的特性,而且Java在设计之初就认为字节码是要在网络中传输的,为了减少网络传输流量,字节码就要尽量设计精简、紧凑。因而Java增加了很多重复指令,比如尽量减少操作数,因而我们会发现Java的很多指令都是没有操作数的;并且指令中的操作数基本上都是当无法将值放到栈中的数据,比如局部变量的索引号和常量池中的索引号。
还有一点需要注意的是,在运行过程中,所有boolean、byte、char、short都是以int类型值存在,因而对这些类型的指令操作很少。然而好像sun实现的虚拟机中。这些类型的数组据说不是以int类型的形式保存的,这个很奇怪。我的理解,以字对齐方式的操作效率会比较高,因而做了这种转换,以空间换时间。
Java指令集(按功能分类)
常量入栈指令 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
aconst_null | null值入栈。 | |
iconst_m1 | -1(int)值入栈。 | |
iconst_0 | 0(int)值入栈。 | |
iconst_1 | 1(int)值入栈。 | |
iconst_2 | 2(int)值入栈。 | |
iconst_3 | 3(int)值入栈。 | |
iconst_4 | 4(int)值入栈。 | |
iconst_5 | 5(int)值入栈。 | |
lconst_0 | 0(long)值入栈。 | |
lconst_1 | 1(long)值入栈。 | |
fconst_0 | 0(float)值入栈。 | |
fconst_1 | 1(float)值入栈。 | |
fconst_2 | 2(float)值入栈。 | |
dconst_0 | 0(double)值入栈。 | |
dconst_1 | 1(double)值入栈。 | |
bipush | valuebyte | valuebyte值带符号扩展成int值入栈。 |
sipush | valuebyte1 valuebyte2 | (valuebyte1 << 8) | valuebyte2 值带符号扩展成int值入栈。 |
ldc | indexbyte1 | 常量池中的常量值(int, float, string reference, object reference)入栈。 |
ldc_w | indexbyte1 indexbyte2 | 常量池中常量(int, float, string reference, object reference)入栈。 |
ldc2_w | indexbyte1 indexbyte2 | 常量池中常量(long, double)入栈。 |
局部变量值转载到栈中指令 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
(wide)aload | indexbyte | 从局部变量indexbyte中装载引用类型值入栈。 |
aload_0 | 从局部变量0中装载引用类型值入栈。 | |
aload_1 | 从局部变量1中装载引用类型值入栈。 | |
aload_2 | 从局部变量2中装载引用类型值入栈。 | |
aload_3 | 从局部变量3中装载引用类型值入栈。 | |
(wide)iload | indexbyte | 从局部变量indexbyte中装载int类型值入栈。 |
iload_0 | 从局部变量0中装载int类型值入栈。 | |
iload_1 | 从局部变量1中装载int类型值入栈。 | |
iload_2 | 从局部变量2中装载int类型值入栈。 | |
iload_3 | 从局部变量3中装载int类型值入栈。 | |
(wide)lload | indexbyte | 从局部变量indexbyte中装载long类型值入栈。 |
lload_0 | 从局部变量0中装载int类型值入栈。 | |
lload_1 | 从局部变量1中装载int类型值入栈。 | |
lload_2 | 从局部变量2中装载int类型值入栈。 | |
lload_3 | 从局部变量3中装载int类型值入栈。 | |
(wide)fload | indexbyte | 从局部变量indexbyte中装载float类型值入栈。 |
fload_0 | 从局部变量0中装载float类型值入栈。 | |
fload_1 | 从局部变量1中装载float类型值入栈。 | |
fload_2 | 从局部变量2中装载float类型值入栈。 | |
fload_3 | 从局部变量3中装载float类型值入栈。 | |
(wide)dload | indexbyte | 从局部变量indexbyte中装载double类型值入栈。 |
dload_0 | 从局部变量0中装载double类型值入栈。 | |
dload_1 | 从局部变量1中装载double类型值入栈。 | |
dload_2 | 从局部变量2中装载double类型值入栈。 | |
dload_3 | 从局部变量3中装载double类型值入栈。 | |
aaload | 从引用类型数组中装载指定项的值。 | |
iaload | 从int类型数组中装载指定项的值。 | |
laload | 从long类型数组中装载指定项的值。 | |
faload | 从float类型数组中装载指定项的值。 | |
daload | 从double类型数组中装载指定项的值。 | |
baload | 从boolean类型数组或byte类型数组中装载指定项的值(先转换为int类型值,后压栈)。 | |
caload | 从char类型数组中装载指定项的值(先转换为int类型值,后压栈)。 | |
saload | 从short类型数组中装载指定项的值(先转换为int类型值,后压栈)。 | |
将栈顶值保存到局部变量中指令 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
(wide)astore | indexbyte | 将栈顶引用类型值保存到局部变量indexbyte中。 |
astroe_0 | 将栈顶引用类型值保存到局部变量0中。 | |
astore_1 | 将栈顶引用类型值保存到局部变量1中。 | |
astore_2 | 将栈顶引用类型值保存到局部变量2中。 | |
astore_3 | 将栈顶引用类型值保存到局部变量3中。 | |
(wide)istore | indexbyte | 将栈顶int类型值保存到局部变量indexbyte中。 |
istore_0 | 将栈顶int类型值保存到局部变量0中。 | |
istore_1 | 将栈顶int类型值保存到局部变量1中。 | |
istore_2 | 将栈顶int类型值保存到局部变量2中。 | |
istore_3 | 将栈顶int类型值保存到局部变量3中。 | |
(wide)lstore | indexbyte | 将栈顶long类型值保存到局部变量indexbyte中。 |
lstore_0 | 将栈顶long类型值保存到局部变量0中。 | |
lstore_1 | 将栈顶long类型值保存到局部变量1中。 | |
lstore_2 | 将栈顶long类型值保存到局部变量2中。 | |
lstroe_3 | 将栈顶long类型值保存到局部变量3中。 | |
(wide)fstore | indexbyte | 将栈顶float类型值保存到局部变量indexbyte中。 |
fstore_0 | 将栈顶float类型值保存到局部变量0中。 | |
fstore_1 | 将栈顶float类型值保存到局部变量1中。 | |
fstore_2 | 将栈顶float类型值保存到局部变量2中。 | |
fstore_3 | 将栈顶float类型值保存到局部变量3中。 | |
(wide)dstore | indexbyte | 将栈顶double类型值保存到局部变量indexbyte中。 |
dstore_0 | 将栈顶double类型值保存到局部变量0中。 | |
dstore_1 | 将栈顶double类型值保存到局部变量1中。 | |
dstore_2 | 将栈顶double类型值保存到局部变量2中。 | |
dstore_3 | 将栈顶double类型值保存到局部变量3中。 | |
aastore | 将栈顶引用类型值保存到指定引用类型数组的指定项。 | |
iastore | 将栈顶int类型值保存到指定int类型数组的指定项。 | |
lastore | 将栈顶long类型值保存到指定long类型数组的指定项。 | |
fastore | 将栈顶float类型值保存到指定float类型数组的指定项。 | |
dastore | 将栈顶double类型值保存到指定double类型数组的指定项。 | |
bastroe | 将栈顶boolean类型值或byte类型值保存到指定boolean类型数组或byte类型数组的指定项。 | |
castore | 将栈顶char类型值保存到指定char类型数组的指定项。 | |
sastore | 将栈顶short类型值保存到指定short类型数组的指定项。 | |
wide指令 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
wide | 使用附加字节扩展局部变量索引(iinc指令特殊)。 | |
通用(无类型)栈操作指令 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
nop | 空操作。 | |
pop | 从栈顶弹出一个字长的数据。 | |
pop2 | 从栈顶弹出两个字长的数据。 | |
dup | 复制栈顶一个字长的数据,将复制后的数据压栈。 | |
dup_x1 | 复制栈顶一个字长的数据,弹出栈顶两个字长数据,先将复制后的数据压栈,再将弹出的两个字长数据压栈。 | |
dup_x2 | 复制栈顶一个字长的数据,弹出栈顶三个字长的数据,将复制后的数据压栈,再将弹出的三个字长的数据压栈。 | |
dup2 | 复制栈顶两个字长的数据,将复制后的两个字长的数据压栈。 | |
dup2_x1 | 复制栈顶两个字长的数据,弹出栈顶三个字长的数据,将复制后的两个字长的数据压栈,再将弹出的三个字长的数据压栈。 | |
dup2_x2 | 复制栈顶两个字长的数据,弹出栈顶四个字长的数据,将复制后的两个字长的数据压栈,再将弹出的四个字长的数据压栈。 | |
swap | 交换栈顶两个字长的数据的位置。Java指令中没有提供以两个字长为单位的交换指令。 | |
类型转换指令 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
i2f | 将栈顶int类型值转换为float类型值。 | |
i2l | 将栈顶int类型值转换为long类型值。 | |
i2d | 将栈顶int类型值转换为double类型值。 | |
f2i | 将栈顶float类型值转换为int类型值。 | |
f2l | 将栈顶float类型值转换为long类型值。 | |
f2d | 将栈顶float类型值转换为double类型值。 | |
l2i | 将栈顶long类型值转换为int类型值。 | |
l2f | 将栈顶long类型值转换为float类型值。 | |
l2d | 将栈顶long类型值转换double类型值。 | |
d2i | 将栈顶double类型值转换为int类型值。 | |
d2f | 将栈顶double类型值转换为float类型值。 | |
d2l | 将栈顶double类型值转换为long类型值。 | |
i2b | 将栈顶int类型值截断成byte类型,后带符号扩展成int类型值入栈。 | |
i2c | 将栈顶int类型值截断成char类型值,后带符号扩展成int类型值入栈。 | |
i2s | 将栈顶int类型值截断成short类型值,后带符号扩展成int类型值入栈。 | |
整数运算 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
iadd | 将栈顶两int类型数相加,结果入栈。 | |
isub | 将栈顶两int类型数相减,结果入栈。 | |
imul | 将栈顶两int类型数相乘,结果入栈。 | |
idiv | 将栈顶两int类型数相除,结果入栈。 | |
irem | 将栈顶两int类型数取模,结果入栈。 | |
ineg | 将栈顶int类型值取负,结果入栈。 | |
ladd | 将栈顶两long类型数相加,结果入栈。 | |
lsub | 将栈顶两long类型数相减,结果入栈。 | |
lmul | 将栈顶两long类型数相乘,结果入栈。 | |
ldiv | 将栈顶两long类型数相除,结果入栈。 | |
lrem | 将栈顶两long类型数取模,结果入栈。 | |
lneg | 将栈顶long类型值取负,结果入栈。 | |
(wide)iinc | indexbyte constbyte | 将整数值constbyte加到indexbyte指定的int类型的局部变量中。 |
浮点运算 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
fadd | 将栈顶两float类型数相加,结果入栈。 | |
fsub | 将栈顶两float类型数相减,结果入栈。 | |
fmul | 将栈顶两float类型数相乘,结果入栈。 | |
fdiv | 将栈顶两float类型数相除,结果入栈。 | |
frem | 将栈顶两float类型数取模,结果入栈。 | |
fneg | 将栈顶float类型值取反,结果入栈。 | |
dadd | 将栈顶两double类型数相加,结果入栈。 | |
dsub | 将栈顶两double类型数相减,结果入栈。 | |
dmul | 将栈顶两double类型数相乘,结果入栈。 | |
ddiv | 将栈顶两double类型数相除,结果入栈。 | |
drem | 将栈顶两double类型数取模,结果入栈。 | |
dneg | 将栈顶double类型值取负,结果入栈。 | |
逻辑运算——移位运算 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
ishl | 左移int类型值。 | |
lshl | 左移long类型值。 | |
ishr | 算术右移int类型值。 | |
lshr | 算术右移long类型值。 | |
iushr | 逻辑右移int类型值。 | |
lushr | 逻辑右移long类型值。 | |
逻辑运算——按位布尔运算 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
iand | 对int类型按位与运算。 | |
land | 对long类型的按位与运算。 | |
ior | 对int类型的按位或运算。 | |
lor | 对long类型的按位或运算。 | |
ixor | 对int类型的按位异或运算。 | |
lxor | 对long类型的按位异或运算。 | |
控制流指令——条件跳转指令 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
ifeq | branchbyte1 branchbyte2 | 若栈顶int类型值为0则跳转。 |
ifne | branchbyte1 branchbyte2 | 若栈顶int类型值不为0则跳转。 |
iflt | branchbyte1 branchbyte2 | 若栈顶int类型值小于0则跳转。 |
ifle | branchbyte1 branchbyte2 | 若栈顶int类型值小于等于0则跳转。 |
ifgt | branchbyte1 branchbyte2 | 若栈顶int类型值大于0则跳转。 |
ifge | branchbyte1 branchbyte2 | 若栈顶int类型值大于等于0则跳转。 |
if_icmpeq | branchbyte1 branchbyte2 | 若栈顶两int类型值相等则跳转。 |
if_icmpne | branchbyte1 branchbyte2 | 若栈顶两int类型值不相等则跳转。 |
if_icmplt | branchbyte1 branchbyte2 | 若栈顶两int类型值前小于后则跳转。 |
if_icmple | branchbyte1 branchbyte2 | 若栈顶两int类型值前小于等于后则跳转。 |
if_icmpgt | branchbyte1 branchbyte2 | 若栈顶两int类型值前大于后则跳转。 |
if_icmpge | branchbyte1 branchbyte2 | 若栈顶两int类型值前大于等于后则跳转。 |
ifnull | branchbyte1 branchbyte2 | 若栈顶引用值为null则跳转。 |
ifnonnull | branchbyte1 branchbyte2 | 若栈顶引用值不为null则跳转。 |
if_acmpeq | branchbyte1 branchbyte2 | 若栈顶两引用类型值相等则跳转。 |
if_acmpne | branchbyte1 branchbyte2 | 若栈顶两引用类型值不相等则跳转。 |
控制流指令——比较指令 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
lcmp | 比较栈顶两long类型值,前者大,1入栈;相等,0入栈;后者大,-1入栈。 | |
fcmpl | 比较栈顶两float类型值,前者大,1入栈;相等,0入栈;后者大,-1入栈;有NaN存在,-1入栈。 | |
fcmpg | 比较栈顶两float类型值,前者大,1入栈;相等,0入栈;后者大,-1入栈;有NaN存在,-1入栈。 | |
dcmpl | 比较栈顶两double类型值,前者大,1入栈;相等,0入栈;后者大,-1入栈;有NaN存在,-1入栈。 | |
dcmpg | 比较栈顶两double类型值,前者大,1入栈;相等,0入栈;后者大,-1入栈;有NaN存在,-1入栈。 | |
控制流指令——无条件跳转指令 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
goto | branchbyte1 branchbyte2 | 无条件跳转到指定位置。 |
goto_w | branchbyte1 branchbyte2 branchbyte3 branchbyte4 | 无条件跳转到指定位置(宽索引)。 |
控制流指令——表跳转指令 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
tableswitch | <0-3bytepad> defaultbyte1 defaultbyte2 defaultbyte3 defaultbyte4 lowbyte1 lowbyte2 lowbyte3 lowbyte4 highbyte1 highbyte2 highbyte3 highbyte4 jump offsets... | 通过索引访问跳转表,并跳转。 |
lookupswitch | <0-3bytepad> defaultbyte1 defaultbyte2 defaultbyte3 defaultbyte4 npairs1 npairs2 npairs3 npairs4 match offsets | 通过键值访问跳转表,并跳转。 |
控制流指令——异常和finally | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
athrow | 抛出异常。 | |
jsr | branchbyte1 branchbyte2 | 跳转到子例程序。 |
jsr_w | branchbyte1 branchbyte2 branchbyte3 branchbyte4 | 跳转到子例程序(宽索引)。 |
(wide)ret | indexbyte | 返回子例程序。 |
对象操作指令 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
new | indexbyte1 indexbyte2 | 创建新的对象实例。 |
checkcast | indexbyte1 indexbyte | 类型强转。 |
instanceof | indexbyte1 indexbyte2 | 判断类型。 |
getfield | indexbyte1 indexbyte2 | 获取对象字段的值。 |
putfield | indexbyte1 indexbyte2 | 给对象字段赋值。 |
getstatic | indexbyte1 indexbyte2 | 获取静态字段的值。 |
putstatic | indexbyte1 indexbyte2 | 给静态字段赋值。 |
数组操作指令 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
newarray | atype | 创建type类型的数组。 |
anewarray | indexbyte1 indexbyte2 | 创建引用类型的数组。 |
arraylength | 获取一维数组的长度。 | |
multianewarray | indexbyte1 indexbyte2 dimension | 创建dimension维度的数组。 |
方法调用指令 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
invokespecial | indexbyte1 indexbyte2 | 编译时方法绑定调用方法。 |
invokevirtual | indexbyte1 indexbyte2 | 运行时方法绑定调用方法。 |
invokestatic | indexbyte1 indexbyte2 | 调用静态方法。 |
invokeinterface | indexbyte1 indexbyte2 count 0 | 调用接口方法。 |
方法返回指令 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
ireturn | 返回int类型值。 | |
lreturn | 返回long类型值。 | |
freturn | 返回float类型值。 | |
dreturn | 返回double类型值。 | |
areturn | 返回引用类型值。 | |
return | void函数返回。 | |
线程同步指令 | ||
操作码(助记符) | 操作数 | 描述(栈指操作数栈) |
monitorenter | 进入并获得对象监视器。 | |
monitorexit | 释放并退出对象监视器。 |
参考《深入解析JVM》 2010年10月6日