这里给大家介绍一款字节码分析小工具——jclasslib bytecode viewer。它可以将字节码文件结构化的展现给我们看。
紧接着上篇『字段表』的分析。后面的分析轮到了『方法表』。
方法表结构
- u2 method_count:
方法计数器,methods_count 的值表示当前 class 文件 methods[]数组的成员个数。 - method_info methods[methods_count]:
方法表,methods[]数组中的每个成员都必须是一个 method_info 结构的数据项,用于表示当前类或接口中某个方法的完整描述。 - method_info 结构:
method_info {
u2 access_flag 1
u2 name_index 1
u2 descriptor_index 1
u2 attribute_count 1
attribute_info attributes[attribute_count]
}
方法表的具体解析
知道方法表的组成结构,我们就可以直接对照着字节码文件去解析了。依然是前文用的java代码示例产生的字节码文件。紧接在『字段表』后面的16进制是0x0004=4。即该类有4个成员方法!看源代码:
public class MyTest2 {
String str = "Welcome";
private int x = 5;
public static Integer in = 10;
public static void main(String[] args) {
MyTest2 myTest2 = new MyTest2();
myTest2.setX(8);
in = 20;
}
public void setX(int x) {
this.x = x;
}
}
源代码中,我们只定义了2个成员方法!但是字节码却说有4个方法。我们用jclasslib小工具打开看一下。展示如下:
这样就一目了然了,其实字节码里除了我们自己显示定义的2个方法main
和setX
。Java编译器生成字节码的时候默认又帮我们生成了2个方法<init>
和<clinit>
。
<init>
方法就是默认的构造方法。我们知道,一个类必须要有至少一个构造方法,用来完成类的实例化过程。当我们没有显示去给一个类定义一个构造方法时,Java编译器在为生成字节码文件时,会默认给它生成一个默认的构造方法。<clinit>
方法是类的构造器。是类初始化阶段要执行的方法,它的职责就是为类的静态变量赋初始值(由程序员定义的那个初始值,在我们的源码中就是静态变量in的初始值10),或者如果类中有静态代码块,那就并按顺序执行静态代码块的代码。
所以,当一个类有静态变量或者静态代码块的时候,Java编译器会为这个类的字节码里生成一个<clinit>
方法,在类初始化阶段去执行!
这就是为什么代码中我们只定义了2个方法,但生成的字节码里却有4个方法的原因了。
分析第一个方法。先看看方法表的部分16进制的信息,如下:从0x004开始。
首先是方法的access_flag(访问标志位),即0x0001。说明此方法是public
。接着是方法的name_index(指向常量池的索引,代表方法的全限定名称),0x0011=17。我借助jclasslib小工具可以查到方法名称是<init>
,就是Java编译器默认生成的构造方法。然后,是该方法的描述符信息descriptor_index,0x0012=18,同样可以查到()V
。这个描述符说明我们的方法是无参的『()
』。且无返回值『V
』。完美符合我们构造方法的定义。
属性表分析
我们再看看它的属性个数,attributes_count
的项的值表示这个方法的附加属性的数量。0x0001=1,说明这个方法只有一个附加属性。那后面就是对属性表的分析了。我们先看一下属性表的结构:
attribute_info {
u2 attribute_name_index;
u4 attibute_length;
u1 info[attibute_length]
}
所以,0x0013=19。表示的就是这个属性的名字在常量池中的索引。查阅得,该属性的名字是『Code』。Code属性很重要,因为Java程序方法中的代码经过javac编译之后形成字节码存在了Code属性内。在这里,我们通过jclasslib先查看一下Code属性里有什么。
红框里的助记符就是<init>
方法里要执行的代码逻辑!
Code属性
- code属性的作用是保存该方法的结构,如所对应的字节码。
Code_attribute {
u2 attribute_name_index;
u4 attribute_length;
u2 max_stack;
u2 max_locals;
u4 code_length;
u1 code[code_length];
u2 exception_table_length;
{ u2 start_pc;
u2 end_pc;
u2 handler_pc;
u2 catch_type;
} exception_table[exception_table_length];
u2 attributes_count;
attribute_info attributes[attributes_count];
}
- Java程序方法体中的代码经过Java编译处理后,最终变成字节码指令存储在Code属性中。Code属性出现在方法表的属性集合中,但是并非所有方法都有这个属性。例如接口或者类中的抽象方法就不存在Code属性。
Code属性其实是一个结构比较复杂的属性表。这里就不做过多描述,打算后面抽个时间用一篇博客来说说它。其实方法表的<init>
方法到此,分析得差不多了。接下来,大家可以再对照一遍,自己去把每个方法都分析一遍,加深印象。