JAVA字节码学习

学习资料来自

深入理解JVM虚拟机

https://juejin.im/post/58ac086d2f301e006c3d6600

https://blog.csdn.net/luanlouis/article/details/50412126

https://segmentfault.com/a/1190000008606277

Java虚拟机的指令由一个字节长度的,代表着某种特定操作含义的数字(简称操作码,Opcode)以及跟随其后的零至多个代表此操作所需参数(称作操作数,Operands)来构成的。Java虚拟机采用面向操作数栈而不是寄存器(Android的Dalvik虚拟机则是依靠寄存器)架构的,所以大多数的指令都不包含操作数,只有一个操作码。

由于Java虚拟机操作码的长度限制在了一个字节(0-255),意味着指令集的操作码总数不可能超过256条。

不考虑异常处理的话,Java虚拟机的解释器可以使用下面的伪代码当做最基本的执行模型来理解:

do{
	自动计算PC寄存器的值+1;
	根据PC寄存器的指示位置,从字节码流中取出操作码;
	if(字节码存在操作数)
	{
		从字节流中取出操作数;
	}
	执行操作码所定义的操作;
}while(字节码长度>0)

字节码与数据类型

在Java虚拟机的指令集中,大多数的指令都包含了其操作所对应的数据类型信息。如iload,fload指令用于从局部变量表中加载int,float型数据到操作数栈中。

对于大部分与数据类型相关的字节码指令,它们的操作码助记符中都有特殊的字符来表明专门为哪种数据类型服务:i代表对int类型的数据操作,l代表long,s代表short,b代表byte,c代表char,f代表float,d代表double,a代表reference。 也有一些指令的助记符中没有明确地指明操作类型的字母,如arraylength指令,它没有代表数据类型的特殊字符,但操作数永远只能是一个数组类型的对象。 还有另外一些指令,如无条件跳转指令goto则是与数据类型无关的。

Java虚拟机指令所支持的数据类型如下:

加载和存储指令

加载和存储指令用于将数据在栈帧中的局部变量表和操作数栈之间来回传输,指令内容如下:

  • 将一个局部变量加载到操作栈:iload,iload_<n>,lload,lload_<n>,fload,fload_<n>,dload,dload_<n>,aload,aload_<n>。
  • 将一个数值从操作栈存储到局部变量表:istore,istore_<n>,lsotre,lsotre_<n>,fsotre,fsotre_<n>,dsotre,dsotre_<n>,asotre,asotre_<n>。
  • 加载一个常量到操作数栈:bipush.sipush,ldc,ldc_w,ldc2_w,aconst_null,iconst_ml,iconst_<i>,lconst_<l>,fconst_<f>,dconst_<d>。
  • 扩充局部变量表的访问索引指令:wide。

记录常量指令的区别:

当int取值-1~5时,JVM采用iconst指令将常量压入栈中。

当int取值-128~127时,JVM采用bipush指令将常量压入栈中。

当int取值-32768~32767时,JVM采用sipush指令将常量压入栈中。

当int取值-2147483648~2147483647时,JVM采用ldc指令将常量压入栈中。

存储数据的操作数栈和局部变量表主要就是由加载和存储指令进行操作,除此之外,还有少量指令,如访问对象的字段或者数组元素的指令也会向操作数栈传输数据。

上述的_<n>表述一组数据,如iload_<n>,它代表了 iload_0、iload_1、iload_2 和 iload_3 这几条指令。iload_0的语义与操作数栈数为0时的iload指令语义完全一致。

运算指令

运算指令用于对两个操作数栈上的值进行某种特定特定运算,并把结果重新存储到操作栈顶。对于运算指令而言可以分成两种:** 对整形数据进行运算的指令与对浮点型数据进行运算的指令。 **无论哪种运算指令,都是用Java虚拟机的数据类型,由于没有直接支持byte,short,char和boolean的运算指令,对于此类的运算,使用操作int类型的指令代替。运算指令如下:

  • 加法指令:iadd,ladd,fadd,dadd。
  • 减法指令:isub,lsub,fsub,dsub。
  • 乘法指令:imul,lmul,fmul,dmul。
  • 除法指令:idiv,ldiv,fdiv,ddiv。
  • 求余指令:irem,lrem,frem,drem。
  • 取反指令:ineg,lneg,fneg,dneg。
  • 位移指令:ishl,ishr,iushr,lshl,lshr,lushr。
  • 按位或指令:ior,lor。
  • 按位与指令:iand,land。
  • 按位异或指令:ixor,lxor。
  • 局部变量自增指令:iinc。
  • 比较指令:dcmpg,dcmpl,fcmpg,fcmpl,lcmp。
类型转换指令

类型转换指令可以让两种不同的数值类型进行互相转换。Java虚拟机直接支持以下数值类型的宽化类型转换(即小范围到大范围的转换):

  • int类型转long,float或者double类型
  • long类型到float,double类型
  • float类型到double类型

对于窄话类型转换,需要显示使用转换指令完成,指令包括:i2b,i2c,i2s,l2i,f2i,f2l,d2i,d2l,d2f。对于窄化类型转换结果会导致转换结果产生不同的正负号,精度丢失的情况,比如float转int。

对象创建和访问指令

虽然类实例和数组都是对象,但是Java虚拟机对于这两种的创建和操作使用了不同的字节码指令,对象创建后,就可以通过对象访问指令获取对象实例或者数组实例中的字段或者数组元素。对应指令如下:

  • 创建类实例的指令:new。
  • 创建数组的指令:newarray,anewarray,multianewarray。
  • 访问类变量和实例变量的指令:getfield,putfield,getstatic,putstatic。
  • 把一个数组元素加载到操作数栈的指令:baload,caload,saload,iaload,laload,faload,daload,aaload。
  • 把一个操作数栈的值存储到数组元素中的指令:bstore,castore,sastore,iastore,fastore,dastore,aastore。
  • 取数组长度的指令:arraylength。
  • 检查类实例类型的指令:instanceof,checkcast。
操作数栈管理指令

Java虚拟机提供了一下直接操作操作数栈的指令,包括:

  • 将操作数栈的栈顶一个或者两个元素出栈:pop,pop2。
  • 复制栈顶一个或者两个数值并将复制值或者双份的复制值重新压入栈顶:dup,dup2,dup_x1,dup2_x1,dup_x2,dup2_x2。
  • 将栈最顶端的两个数值互换:swap。
控制转移指令

控制转移指令就是在有条件或者无条件修改pc寄存器的值,即代码中的if,else,switch等关键字,指令如下:

  • 条件分支:ifeq、ifne、iflt、ifle、ifgt、ifge、ifnull、ifnonnull、if_icmpeq、if_icmpne、if_icmplt、if_icmple、if_icmpgt、if_icmpge、if_acmpeq和if_acmpne。
  • 复合条件分支:tableswitch、lookupswitch。
  • 无条件分支:goto、goto_w、jsr、jsr_w、ret。
方法调用和返回指令
  • invokevirtual指令:调用对象的实例方法,根据对象的实际类型进行分派(虚方法分派)。
  • invokeinterface指令:调用接口方法,在运行时搜索一个实现这个接口方法的对象,找出合适的方法进行调用。
  • invokespecial:调用需要特殊处理的实例方法,包括实例初始化方法,私有方法和父类方法
  • invokestatic:调用类方法(static)
  • invokedynamic:用于运行时动态解析出调用点限定符所引用的方法,并执行该方法。

方法返回指令是根据返回值的类型区分的,包括ireturn(返回值是boolean,byte,char,short和 int),lreturn,freturn,drturn和areturn,另外一个return供void方法,实例初始化方法,类和接口的类初始化i方法使用。

异常处理指令

在Java程序中显式抛出异常的操作(throw语句)都有athrow 指令来实现,除了用throw 语句显示抛出异常情况外,Java虚拟机规范还规定了许多运行时异常会在其他Java虚拟机指令检测到异常状况时自动抛出。 在Java虚拟机中,处理异常不是由字节码指令来实现的,而是采用异常表来完成的。

同步指令

方法级的同步是隐式的,无需通过字节码指令来控制,它实现在方法调用和返回操作中。虚拟机从方法常量池中的方法标结构中的 ACC_SYNCHRONIZED标志区分是否是同步方法。方法调用时,调用指令会检查该标志是否被设置,若设置,执行线程先成功持有管程,然后才能执行方法,最后方法完成释放管程。

如果在同步方法执行期间,方法抛了异常,并且在内部无法处理异常,这个同步方法所持有的管程将会在异常抛到外部时自动释放。

同步一段指令集序列,通常由synchronized块标示,JVM指令集中有monitorenter和monitorexit来支持synchronized语义。 结构化锁定是指方法调用期间每一个monitor退出都与前面monitor进入相匹配的情形。


总结:

这里只是学习了一下理论的知识,弄明白了对应指令做的对应的事情,通过javap反编译出来的文件中就包含了对应的指令:

public int testInt(java.lang.Object);
   descriptor: (Ljava/lang/Object;)I
   flags: ACC_PUBLIC
   Code:
     stack=2, locals=7, args_size=2
        0: aload_1
        1: dup
        2: astore_2
        3: monitorenter
        4: bipush        11
        6: istore_3
        7: bipush        22
        9: istore        4
       11: aload_1
       12: invokevirtual #12                 // Method java/lang/Object.hashCod
:()I
       15: iconst_2
       16: irem
       17: ifne          27
       20: bipush        33
       22: istore_3
       23: bipush        44
       25: istore        4
       27: iload_3
       28: iload         4
       30: iadd
       31: istore        5
       33: iload         5
       35: aload_2
       36: monitorexit
       37: ireturn
       38: astore_3
       39: iconst_0
       40: aload_2
       41: monitorexit
       42: ireturn
       43: astore        6
       45: aload_2
       46: monitorexit
       47: aload         6
       49: athrow

在之后的学习中,需要应用的对应的分析当中,明白上述的执行过程。

转载于:https://my.oschina.net/u/3863980/blog/1866388

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值