Class文件格式只有两种数据类型:无符号数和表。
1.魔数与Class 文件的版本
每个Class文件的头4个字节称为魔数,它的唯一作用是确定这个文件是否为一个能被虚拟机接受的Class文件。紧接着魔数的4个字节存储的是Class文件的版本号:第5和第6个字节是此版本号,第7和第8个字节是主版本号。
2.常量池
紧接着主次版本号后面的是常量池入口,常量池可以理解为Class文件之中的资源仓库。它是Class文件结构中与其他项目关联最多的数据结构,也是占用Class文件空间最大的数据项目之一。
常量池主要存放两大类常量:字面量和符号引用。字面量比较接近于Java语言层面的常量概念,如文本字符串,声明为final的常量值等。而符号引用则属于编译原理方面的概念,包括类和接口的全限定名、字段的名称和描述符、方法的名称和描述符。
3.访问标志
在常量池结束之后,紧接着的两个字节代表访问标志,这个标志用于识别一些类或者接口层次的访问信息。包括:这个Class是类还是接口;是否定义为public;是否定义abstract等。
4.类索引、父类索引与接口索引集合
Class文件中由这三项数据来确定这个类的继承关系。类索引用于确定这个类的全限定名、父类索引用于确定这个类的父类的全限定名、接口索引用于描述这个类实现了哪些接口。
5.字段表集合
字段表用于描述接口或者类中声明的变量。
6.方法表集合
用于存储对方法的描述
7.属性表集合
在Class文件、字段表、方法表都可以携带字节的属性表集合,以用于描述某些场景专有的信息。
8.其他
JVM在处理boolean、byte、short、char类型的数组时,会转换为对应的int类型的字节码指令来处理。
Java虚拟机规范描绘了Java虚拟机应有的共同程序存储格式:Class文件格式以及字节码指令集。这些内容与硬件、操作系统及具体的虚拟机实现是完全独立的。
Java虚拟机实现主要有两种方式:
将输入的Java虚拟机代码在加载或执行时翻译成另外一种虚拟机的指令集。
将输入的Java虚拟机代码在加载或执行时翻译成宿主机CPU的本地指令集(JIT代码生成技术)