java class文件 代码_Java字节码(.class文件)的代码解析

Java二进制指令代码以以下格式紧凑排列(opcode占一个字节):

opcode operand*

除了tableswitch和lookupswitch两条指令中间存在填充字节以外,其他指令都没有填充字节,即使在两条指令之间也没有。因而在读取指令的时候,要根据指令的定义读取。

通过对上面Java指令集的分析可以知道,Java指令集中很大一部分没有操作数,因而对这部分指令,只需要读取一个字节的操作码,将操作码映射成助记符即可。

而对其他带操作数的指令,则需要根据不同类型分析(由于apache中的bcel(Binary Code Engineering Library)对字节码的支持,操作码和助记符的映射可以用com.sun.org.apache.bcel.internal.Constats中提供的映射表数组来完成)。

1.处理两条特殊的指令tableswitch和lookupswitch指令。

对这两条指令,首先都要去掉填充字符以使defaultbyte1索引号是字对齐的。

private static voidmake4ByteAlignment(ByteSequence codes) {

intusedBytes = codes.getIndex() % 4;

intpaddingBytes = (usedBytes == 0) ? 0 : 4 - usedBytes;

for(inti = 0;i < paddingBytes;i++) {

codes.readByte();

}

}

对tableswitch指令,读取defaultoffset值,最小项的值,最大项的值以及在最小项和最大项之间每一项的offset值。并且将读取到的offset值和当前指令的基地址相加:

intdefaultOffset1 = baseOffset + codes.readInt();

builder.append("\tdefault = #"+ defaultOffset1);

intlow = codes.readInt();

inthigh = codes.readInt();

intnpair1 = high - low + 1;

builder.append(", npairs = "+ npair1 +"\n");

for(inti = low;i <= high;i++) {

intmatch = i;

offset = baseOffset + codes.readInt();

builder.append(String.format("\tcase %d : #%d\n", match, offset));

}

对lookupswitch指令,读取defaultoffset值,键值对数值(npairs),以及npairs对的键值对,将得到的offset值和当前指令的基地址相加:

intdefaultOffset2 = baseOffset + codes.readInt();

builder.append("\tdefault = #"+ defaultOffset2);

intnpairs2 = codes.readInt();

builder.append(", npairs = "+ npairs2 +"\n");

for(inti = 0;i < npairs2;i++) {

intmatch = codes.readInt();

offset = baseOffset + codes.readInt();

builder.append(String.format("\tcase %d : #%d\n", match, offset));

}

2.所有条件跳转指令都有两个字节的偏移量操作数(if, if_icmp, ifnull, ifnonnull, if_acmp)。无条件跳转指令goto和子例程跳转指令jsr也都是两个字节的偏移量作为操作数。

offset = baseOffset + codes.readShort();

builder.append(String.format("\t\t#%d\n", offset));

3.对宽偏移量的跳转指令goto_w和子例程跳转指令jsr_w的操作数是四个字节的偏移量。

offset = baseOffset + codes.readInt();

builder.append(String.format("\t\t#%d\n", offset));

4.wide指令,则继续读取下一条指令,并将wide参数设置为true。

byteCodeToString(codes, pool, verbose, true);

5.还有一些指令值以一个字节的局部变量索引号作为操作数的,如果有wide修饰,则用两个字节作为操作数,代表局部变量索引号。这样的指令有:aload, iload, fload, lload, dload, astore, istore, fstore, lstore, dstore, ret。

if(wide) {

index = codes.readUnsignedShort();

}else{

index = codes.readUnsignedByte();

}

builder.append(String.format("\t\t%%%d\n", index));

6.iinc指令,以一个字节的局部变量索引号和一个自己的常量作为参数;如果以wide修饰,则该指令的局部变量索引号和常量都占两个字节。

if(wide) {

index = codes.readUnsignedShort();

constValue = codes.readShort();

}else{

index = codes.readUnsignedByte();

constValue = codes.readByte();

}

builder.append(String.format("\t\t%d %d\n", index, constValue));

7.对象操作指令,它们的操作数都是常量池中的索引,长度为两个字节。指向CONSTANT_Class_info类型的结构,这些指令有new, checkcast, instanceof, anewarray。

index = codes.readUnsignedShort();

builder.append("\t\t"+ pool.getClassInfo(index).toInstructionString(verbose) +"\n");

8.所有字段操作指令,它们的操作数都是常量池中的索引,长度为两个字节。指向CONSTANT_Fieldref_info类型结构,这些指令有getfield, putfield, getstatic, putstatic。

index = codes.readUnsignedShort();

builder.append("\t\t"+ pool.getFieldRefInfo(index).toInstructionString(verbose) +"\n");

9.非接口方法调用指令,也都是以两个字节的索引号作为操作数,指向常量池中的CONSTANT_Methodref_info类型结构,这些指令有invokespecial, invokevirtual, invokestatic。

index = codes.readUnsignedShort();

builder.append("\t\t"+ pool.getMethodRefInfo(index).toInstructionString(verbose) +"\n");

10.接口方法调用指令invokeinterface,它有四个字节的操作数,前两个字节为常量池的索引号,指向CONSTANT_InterfaceMethodref_info类型,第三个字节为count,表示参数的字节数,最后一个字节为0值。

index = codes.readUnsignedShort();

intnargs = codes.readUnsignedByte();//Historical, redundant

builder.append("\t\t"+ pool.getInterfaceMethodRefInfo(index).toInstructionString(verbose));

builder.append(" : "+ nargs +"\n");

codes.readUnsignedByte();//reserved should be zero

11.基本类型的数组创建指令newarray,它的操作数为一个字节的类型标识。

String type = Constants.TYPE_NAMES[codes.readByte()];

builder.append(String.format("\t\t(%s)\n", type));

12.多维数组的创建指令multianewarray,它有三个字节的操作数,前两个字节为索引号,指向CONSTANT_Class_info类型,表示数组的类型,最后一个字节指定数组的维度。

index = codes.readUnsignedShort();

intdimensions = codes.readUnsignedByte();

builder.append(String.format("\t\t%s (%d)\n", pool.getClassInfo(index).getName(), dimensions));

13.常量入栈指令ldc,以一个字节的索引号作为参数,指向CONSTANT_Integer_info、CONSTANT_Float_info、CONSTANT_String_info、CONSTANT_Class_info类型,表示要入栈的常量值(int类型值、float类型值、String引用类型值或对象引用类型值)。

index = codes.readUnsignedByte();

builder.append("\t\t"+ pool.getPoolItem(index).toInstructionString(verbose) +"\n");

14.宽索引的常量入栈指令ldc_w,以两个字节的索引号作为参数,指向CONSTANT_Integer_info、CONSTANT_Float_info、CONSTANT_String_info、CONSTANT_Class_info类型,表示要入栈的常量值(int类型值、float类型值、String引用类型值或对象引用类型值)。

index = codes.readUnsignedShort();

builder.append("\t\t"+ pool.getPoolItem(index).toInstructionString(verbose) +"\n");

15.宽索引的常量入栈指令ldc2_w,以两个字节的索引号作为参数,指向CONSTANT_Long_info、CONSTANT_Double_info类型,表示要入栈的常量值(long类型值、double类型值)。

index = codes.readUnsignedShort();

builder.append("\t\t"+ pool.getPoolItem(index).toInstructionString(verbose) +"\n");

16.bipush指令,以一个字节的常量作为操作数。

byteconstByte = codes.readByte();

builder.append(“\t” + constByte);

17.sipush指令,以两个字节的常量作为操作数。

shortconstShort = codes.readShort();

builder.append(“\t” + constShort);

以上还有一些没有完成的代码,包括字段(方法)的签名和描述符没有解析,有一些解析的格式还需要调整等。不管怎么样,总体的结构就是这样了,其它的都是细节问题,这里不讨论了。

参见bcel项目的org.apache.bcel.classfile.Utility类.

2010年10月6日

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值