class文件是一组以八个字节为基础单位的二进制流,没有任何分隔符,如果遇到需要占用8个字节以上空间的数据项时,会按照高位在前的方式分割成若干个8个字节进行存储
class文件格式采用一种类似于C语言结构体的伪结构来存储数据,只有两种数据类型:“无符号数”和“表”
无符号数:基本的数据类型,以u1,u2,u4,u8分别代表1、2、3、8个字节的无符号数
表:由多个无符号数或者其他表作为数据项构成的复合数据类型
为了便于区分,所有表的命名机关都是以"_info"结尾,表示有层次关系的复合结构的数据,整个class文件本质上也可以视为一张表
魔数与版本号:
每个class文件的头4个字节被称为魔数,唯一作用就是确定这个文件是否为一个能被虚拟机接受的class文件
class文件的魔数值为0xCAFEBABE
紧接的4个字节存储的是class文件的版本号:5-6是次版本号(Minor Version),7-8是主版本号(Major Version)
我写了一个样例代码,把生成的class文件用16进制编辑器打开可以看到前4个字节cafebabe是魔数,后面四个字节分别是版本号,次版本号是00,主版本号是37,37转换成10进制是53,说明可以被JDK9及以上的版本解析
class test01 {
private int m_private;
protected int m_proteted;
public int m_public;
public int inc() {
m_public++;
return m_public;
}
}

常量池:
常量池可以比喻为class文件中的资源仓库,是class文件中与其他项目关联最多的数据
由于常量池中常量的数量是不固定的,所以在入口放置一个u2类型的数据代表常量池的容量计数值,比如我上面的实例代码中的0018就代表常量池中的常量数量,转换成10进制就是24,就代表常量池中有23个常量,索引值范围为1-23(第0个索引对应的常量通常是空出来有特殊考虑的,用来表示不引用任何一个常量的话,通常就指向0)
常量池中存放的主要是两大类常量:字面量和符号引用
字面量:比较接近java语言层面的常量概念,如文本字符串、被声明为final的常量值等
符号引用:属于编译原理方面的概念
被模块导出或开放的包
类和接口的全限定名
字段的名称和描述符
方法的名称和描述符
方法句柄和方法类型
动态调用点和动态常量
符号引用存放的并不是各个方法、字段最终在内存中的布局信息,而是在虚拟机啊加载class文件的时候进行动态连接,class文件中的这些字段、符号的引用不经过虚拟机在运行期间转换的话是无法得到真正的内存入口地址,也就是无法直接被虚拟机使用。
常量池中的每一项常量都是一个表,第一位是个u1类型的标志位,代表当前常量属于哪种常量类型
下面是对23个常量的字节码文件分析






















总结一下这23个常量:

首先是一个方法信息,可以追踪到这个方法属于Object,方法名是init,描述符是()v
然后是一个字段信息,可以追踪到属于test01类,名字是m_public,描述符是I
访问标志:
常量池后面紧跟着的2个字节表示访问标志,标识一些类或接口层次的访问信息
注意这里不同标志位之间是或的关系,例如如果既满足是public,又是接口的话,就需要把接口对应的标志位与public的标志位进行或运算,最后得到的才是真正的访问标志
类索引、父类索引与接口索引集合:
类索引和父类索引都是一个u2类型的数据,各自指向一个类型为CONSTANT_Class_info的类描述符常量(这两个常量都在常量池中)
接口索引集合是一组u2类型的数据的集合
类索引:确定这个类的全限定类名
父类索引:确定这个类的父类的全限定名,除了Object之外,所有的java类都有父类

(图里4个框分别是访问标志、类索引、父类索引以及接口索引集合)
对于接口索引集合:第一项u2标识接口计数器,如果没有任何接口值为0
1347

被折叠的 条评论
为什么被折叠?



