每个class文件都对应唯一一个类或接口的定义信息,但类或接口不一定定义在文件里(类或接口通过类加载器直接生成)。
每个class文件都是由8字节为单位的字节流组成,所有16,32,64位长度的数据将被构造成2,4,8个8字节单位来表示。多字节数据项总是按照Big-Endian的顺序进行存储。用项item来描述类结构格式的内容,class文件中,各项按照严格顺序连续存放的,之间无任何填充或对齐作为各项间的分割符号。
class文件格式采用一种类似C语言结构体的伪结构来存储数据
- 无符号数:基本数据类型,u1、u2、u4、u8分别代表1、2、4、8字节的无符号数,可用来描述数字、索引引用、数量值或UTF-8编码构成的字符串值。
- 表:多个无符号数或者其他表作为数据项构成的复合数据类型,以"_info"结尾,用于描述有层次关系的复合结构的数据,整个class文件本质上是一张表。
在描述同一类型但数量不定的多个数据时,可使用前置容量计数器加若干个连续的数据项形式--类型的集合
- 魔数:每个class文件的头四个字节,确定该文件是否能被虚拟机接收,相比扩展名更安全
- 版本号:魔数后面的4个字节;5、6个字节是次版本号;7、8个字节是主版本号
- 常量池入口:主版本号之后,常量池是class文件的资源仓库。虚拟机在加载class文件时动态链接,常量池中每一个常量都是一个表,14种结构各不相同表结构数据:UTF8编码字符串,整型字面量,浮点型字面量,长整型字面量,双精度浮点型字面量,类或接口的符号引用,字符串类型字面量,字段的符号引用,类中方法的符号引用,接口中方法的符号引用,字段或方法的部分符号引用,表示方法句柄,标识方法类型,动态方法调用点。
- 常量池入口u2类型数据:常量池容量计数值,从1开始
- 字面量:接近常量概念,文本字符串,声明为final的常量值
- 符号引用:类和接口的全限定名;字段的名称和描述符;方法的名称和描述符
- 常量池入口u2类型数据:常量池容量计数值,从1开始
- 访问标志:常量池结束之后,2个字节代表访问标志,用于识别一些类或者接口层次的访问信息。判断定义final,abstract,public等等;字段数据类型;字段名称。
- 索引:确定类的继承关系
- 类索引
- 父类索引
- 接口索引
- 字段表:描述接口或类中声明的变量。字段包括类级变量和实例级变量,不包括方法内部声明的局部变量。字段访问标志:public,private,protected,static,final,volatile,transient,enum
- 方法表:访问标志,名称索引,描述符索引,属性表集合
- 属性表:class文件,字段表,方法表都可带自己的属性表,以描述某些场景专有信息。