JVM学习笔记之 -- Class文件结构(1)

对于初学者来说,大部分人都还认为Java虚拟机执行Java程序是一件理所当然和天经地义的事情。但其实Java虚拟机不和包括Java在内的任何语言绑定,他只和“Class文件”这种特定的二进制文件格式所关联。使用Java编译器可以把Java代码编译为储存字节码的Class文件,而使用例如JRuby等语言的编译器同样可以把程序代码编译成Class文件,虚拟机并不关心Class的来源是何种语言。那么下面我们就具体来说一下Class文件的内部结构。

Class类文件的结构

Class文件是一组以8位字节位基础单位的二进制流,各项数据项目严格按照顺序紧凑地排列在Class文件之中,中间没有添加任何分隔符,这使得整个Class文件中储存的内容几乎全部是程序运行时的必要数据,没有空隙存在。当遇到需要占用8位字节以上空间的数据项时,则会按照高位在前的方式分割成若干个8位字节进行存储

高位在前的这种顺序称为“Big-Endian”,具体是指最高位字节在地址最低位、最低位字节在地址最高位的顺序来存储数据,它是SPARC、PowerPC等处理器的默认多字节存储顺序。

无符号数 & 表

在Class文件中,文件格式采用一种类似于C语言结构体的为结构来存储数据,这种微结构中只有两种数据类型:无符号数和表,后面的解析都要以这两种数据类型为基础。

无符号数属于基本的数据类型,以u1、u2、u4、u8来分别表示1个字节、2个字节、4个字节和8个字节的无符号数,无符号数可以用来描述数字、索引引用、数量值或者按照UTF-8编码构成字符串值。

表是由多个无符号数或者其他表作为数据项构成的符合数据类型,所有表都习惯性地以“_info”结尾。表用于描述有层次关系的符合结构的数据,整个Class文件本质上就是一张表,如下图所示:Class文件格式

魔数与Class文件的版本

每一个Class文件的头4个字节为魔数(Magic Number),他的唯一错用是确定这个文件是否为一个能被虚拟机接受的Class文件。例如:0xCAFEBABE, 使用魔数而不是扩展名来进行试别主要是基于安全方面的考虑,因为扩展名可以随意改动。

紧接着魔术的4个字节存储的是Class文件的版本号:第5和第6字节是次版本号(Minor Version),第7和第8个字节是主版本号(Major Version)。Java的版本号是从45开始的,JDK1.1之后的每个JDK大版本发布主版本号向上加1,高版本的JDK能向下兼容以前版本的Class文件,但不能运行以后版本的Class文件,即使文件格式并未发生任何变化,虚拟机与必须拒绝执行超过其他版本号的Class文件。下图为各个版本号对应的JDK:

编译器版本对应版本号

常量池

再主次版本号之后是常量池入口,我们可以将常量池理解为Class文件中的资源仓库,他是Class文件中与其他项目关联最多的数据类型,也是占用Class文件空间最大的数据项目之一,同时也是Class文件中第一个出现的表类型数据项目。由于常量池中常量的数量是不固定的,所以在第8个字节之后常量池入口位置防止一个u2类型的数据(及第9位和第10位),代表常量池容量计数值。

注意在常量池中,容量计数是从1开始的,例如常量池容量为十六进制0x0016,及十进制22,这就代表了有21个常量,索引从1-21.

常量池中主要存放两大类常量:字面量(Literal)和符号引用(Symbolic References)。其中字面量比较接近于Java语言层面的常量概念,如文本字符串、声明为final的常量等。而字符引用树于编译原理方面的概念,包括:类和接口的全限定名,字段的名称和描述符,方法的名称和描述符。
常量池中每一项常量都是一个表,共14种(在JDK 1.7之前有11种)。这14中标有个共同特点,就是表开始的第一位是一个u1类型的标志位(tag)。我们可以通过常量池的常量池对照表对其进行解析。(详情请参考《深入理解Java虚拟机——JVM高级特性与最佳实践(第2版)》)

参考:《深入理解Java虚拟机——JVM高级特性与最佳实践(第2版)》

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值