JVM-Class类文件结构笔记

最新推荐文章于 2024-07-21 23:15:28 发布

TanKDanDin

最新推荐文章于 2024-07-21 23:15:28 发布

阅读量87

点赞数

文章标签： jvm 笔记

本文链接：https://blog.csdn.net/m0_52133525/article/details/133384469

版权

概要：关于学习JVM类文件结构的笔记，主打一手精简但是带一点深度，这里是基于《深入理解Java虚拟机：JVM高级特性与最佳实践（第3版）》一书进行学习的，但是其中有一些地方并不够清晰或者实例不够充分，这里也会讲述，当然只是拙见，有所不足敬请指出。

前提：类的结构

类文件的结构是以8位为基础单位的二进制流(原文说的是8字节，就之后的u1 u2都不是8个字节，肯定说不通……)。由两部分组成，无符号数与表。

无符号数：由1字节、2字节、4字节、8字节分别用u1、u2、u3、u8表示，无符号数可以用来描述数字、索引引用、数量值或者按照UTF-8编码构成字符串值。

表：由无符号数与表组成的复合数据结构。通常以_info结尾表示，class文件可以按哲学的方式也看做一张表……

class类文件是各部分按顺序紧密排列的，顺序如下表，这里附带了解释，以方便一样还在学习的朋友不会看着难受(interface info也与原文不一样，后面会说)

类型	名称	数量	解释
u4	magic	1	魔数
u2	minor_version	1	次版本号
u2	major_version	1	主版本号
u2	constant_pool_count	1	常量池数量
cp_info	constant_pool	constant_pool_count - 1	常量池信息
u2	access_flags	1	访问标志
u2	this_class	1	类索引
u2	super_class	1	父类索引
u2	interface_count	1	实现接口数量
interface_info	interfaces	interface_count	接口索引表
u2	fields_count	1	字段数量
field_info	fields	fields_count	字段信息
u2	methods_count	1	方法数量
method_info	methods	methods_count	方法信息
u2	attributes_count	1	属性数量
attribute_info	attributes	attributes_count	属性信息

1、魔数与版本号

魔数(magic bumber)用来确认一个文件是否为jvm可以接受的格式，class类文件的是0xCAFEBABE，如下图。版本号紧跟在魔数之后，占用4个字节，前两位是次版本号，后两位是主版本号，java版本号从45(jdk1)开始，如下图，0x33 = 51(D),算下来也就是jdk7(这里用jdk7是为了和书上一致)。

2. 常量池

根据最前面的表，过了魔数和版本号，就是常量池了。常量池算是最麻烦的一部分了。其有两部分，1是计数，2是内容。计数是一个u2(也就是两个字节)，用来表示有多少项常量，然后是内容，对应一个一个的常量项。这里提供一个实例：

public class ModelFinal implements InterfaceB, InterfaceC {
    private final static Long MODEL_LONG = 1L;
    private final int modelInt = 99;
    private String modelMsg;

    public ModelFinal() {
    }

    public ModelFinal(String modelMsg) {
        this.modelMsg = modelMsg;
    }

    public String modelInfo() {
        return modelMsg + modelInt + MODEL_LONG;
    }
}

其父接口都是空的，主要为了验证后面的interface集合。用jdk7编译后，使用winhex打开class文件，用数据显示器可以看到常量计数总数是60，但是使用的常量的计数索引是从1开始的，意思就是只有59个常量项，还有一个索引0是留着给没有引用常量的地方使用的(59+1=60)。

知道了常量池的构成后，就讲详细的常量项是怎么样的，任何一个常量项，它的第一个u1，都是表明它的类型的，比如上面那张图，接着的一个常量项就是0A,可以查表找到它的意义，如下

然后再去查表知道它的具体结构，如下图，具体的表太多了，这里贴篇博客参考：JVM——类文件结构_u4acc-CSDN博客

如果只看字节码，哪我们要对照实在有点麻烦，每次都需要去查表，于是可以使用java自带的javap -verbose class类文件的命令，查看类的常量池，前面的代码反汇编后如下图(部分)：

3. 访问标志

访问标志是用来描述类的，像public,final,static等等(不需要多讲吧？)，是一个u2。在全是16进制中的文件里面怎么找到什么地方开始才是访问标志呢？以winhex为例，看下图。因为class的各部分是紧密存放的，我们的代码中可没有感叹号，然后看其是一个u2，而且后面都没有asscii码能表示的字符了，于是猜测这个是访问标志开始了。

光猜不行，我们得算一算。比如前面代码中的类

类标志是public,查下面这张访问标志表可知，acc_public和acc_super为真，直接加起来，

0x1+0x20=0x21,和上面的对的上。至于为什么要把他们加起来，这个本质上其实是用二进制存储的信息，不同位代表不同的状态，加起来说明有某两种状态。比如0x0001,0x0010,只以后两个16进制位举例，是00000001与00010000。也就是说，第1位置1表示public，第5位置1表示final，两位同时置1表示两者都有，都置1和把他们加起来也就一样了，计算机专业应该都能看懂。

4. 类索引、父类索引与接口索引集合

紧接着访问标志的的就是类和父类索引这些了，主要是描述这个类的继承关系。我们都知道java只能有一个父类(而且默认都是Object)，所以类索引和父类索引肯定都只有一个，这二者都用u2表示。在winhex里面查访问标志后面的两位，可知类索引是0x0c也就是十进制12，父类索引是0x0d,也就是十进制13