Class文件是一组以8字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑的排列在Class文件之中,中间没有添加任何分隔符,使得整个class文件中几乎全是运行程序的必要数据。中间也没有任何分隔符,如果遇到占8字节以上空间的数据项,则会按照高位在前的方式分隔成若干个8位字节进行存储。
Class文件按照一种类似于C语言中结构体来存储数据, 这种伪结构中只有两种数据类型,无符号数和表,后面的解析都要围绕这两个来。
无符号数:属于基本的数据类型,以u1,u2,u4,u8来分别代表1,2,4,8个字节的无符号数。
表:表是由多个无符号数或者其他表作为数据项构成的复合数据类型,所有表都习惯的以“_info”来结尾。表用于描述有层次关系的复合结构的数据,整个class文件本质就是一张表。
每个class文件的头四个字节被称为魔数,他的唯一作用是确定这个文件是否为一个能被虚拟机接受的class文件。其实很多文件也使用魔数来作为标识。
紧接着的四个字节是存储着class文件的版本号;5,6是次版本号,78是主版本号。
版本号之后则是常量池入口,可以理解成class中的资源仓库,也是第一个表结构,再之后是访问标志(2字节),用于识别一些类或者接口层次的访问信息,包括:这个class是接口还是类,是否是abstract的,是否为public的,如果是类的话,是否被声明称final的等。
类索引,父类索引与接口索引集合都按照 顺序排列在访问标志之后,类索引和父类索引用两个u2类型的索引值表示。
字段表集合:用于描述类或者接口中声明的变量。
方法表集合:访问标志,名称索引,描述符索引等等...
属性表集合:一堆属性。。。