JVM之类文件结构

                                                         第六章   类文件结构
6.1   语言无关性的基石     
      实现语言无关性的基础仍然是虚拟机和字节码的存储格式,虚拟机不关心Class的来源是什么语言,只要它符合Class文件应有的结构就可以在Java虚拟机中运行,示意图如图6-1所示:


6.2   Class类文件的结构
  • Class文件是一组以8位字节为基础单元的二进制流,各个数据项目严格按照顺序紧凑地排列在Class文件之中,中间没有添加任何分隔符,这使得整个Class文件中存储的内容几乎全部都是程序运行的必要数据,没有空隙存在;当遇到需要占用8位字节以上空间的数据项时,则会按照高位在前的方式分隔成若干个8位字节进行存储。
  • 根据Java虚拟机规范的规定,Class文件格式采用一种类似于C语言结构体的伪结构来存储,这种伪结构只有两种数据类型:无符号数和表,整个Class文件本质上就是一张表,它的数据项结构如表6-1所示:
      
     其中,u1、u2、u4、u8分别表示1个字节、2个字节、4个字节、8个字节。

     下面对上述表中的各个数据项进行详细介绍:     
      1) 魔数与Class文件的版本:每个Class文件的开头4个字节称为魔数,它的唯一作用是用于确定这个文件是否为一个能被虚拟机接受的Class文件。紧接着魔数的4个字节存储的是Class的版本号:第5、6个字节是次版本号,第7、8个字节是主版本号。Java的版本号是从45开始的,JDK1.1之后的每个大版本发布主版本号向上加1(JDK1.0~1.1使用了45.0~45.3),高版本的JDK能向下兼容以前版本的Class文件,但不能运行以后版本的Class文件,即使文件格式并未发生变化。JDK1.1能支持版本号为45.0~45.65535的Class,无法执行版本号为46.0以上的Class,而JDK1.2能支持45.0~46.65535的Class文件。主流JDK版本编译器输出的默认和可支持的Class文件版本号如表6-2所示:

       2) 常量池:紧接着主次版本号之后的是常量入口,常量池是Class文件结构中与其他项目关联最多的数据类型,也是占用Class文件空间最大的数据项目之一,同时,它还是在Class文件中第一次出现的表类型数据项目。通过u2类型的数据代表常量池容量计数器(constant_pool_count),从1开始计数,0表示不引用任何一个常量池项目。常量池中主要存放两大类常量:字面量(如文本字符串、final常量等)和符号引用(类和接口的全限定名;字段、方法的名称和描述符),常量池中的每一项常量都是一个表,共有11种不同的表结构数据,且第一位都是一个u1类型的标志位(取值1~12,缺少2),代表当前这个常量属于哪种常量类型,他们的结构定义如表6-6所示:
 
           3) 访问标志:紧接常量池后的2个字节代表访问标志(access_flags),用于识别一些类或接口层次的访问信息,包括这个Class是类还是接口;是否定义为public类型;是否定义为abstract类型;若为类,是否定义为final类型等。标志位如表6-7所示:         
 说明:access_flags共有32个标志位,目前只使用了其中的8个,没有用到的标志位要求一律为0。         
            4) 类索引、父类索引与接口索引集合:类索引(this_clsss)和父类索引(super_class)都是一个u2类型的数据,而接口索引集合(interfaces)是一组u2类型的数据的集合,Class文件中由这三项数据来确定这个类的继承关系。     
            5) 字段表集合:字段表(field_info)用于描述接口或类中声明的变量。字段(field)包含了类级别变量或实例级别变量,但不包括方法内部的变量。字段表的结构如下:

          其中access_flags可设置的访问标志及含义如下表:
         
             name_index和descriptor_index都是对常量池的引用,分别代表字段的简单名称及字段和方法的描述符。描述符标识字符含义如下表:

     6) 方法表集合:方法表集合(method_info)用于描述接口或类中声明的方法。方法表结构如下:

     其中,access_flags方法访问标志及其含义如下表:

       7) 属性表集合:在Class文件、字段表、方法表中都可以携带自己的属性表集合,以用于描述某些场景专有的信息。属性表集合不要求属性有严格的顺序,只要不与已有的属性名重复,都可向编译器中添加自定义的属性,虚拟机规范预定义的属性如下表:

       下面分别对个属性进行分析:
  • Code属性:Java程序方法体里面的代码经过javac编译器处理后,最终变为字节码指令存储在Code属性内。Code属性表的结构如下:
  • Exceptions属性:它的作用是列举出方法中可能抛出的受检异常,即方法描述时在throws关键字后面列举的异常。其结构如下表:
  • LineNumberTable属性:用于描述java源码行号与字节码行号(字节码的偏移量)之间的对应关系,它不是必须的运行时必要的属性,可通过javac中使用-g:none或-g:lines选项来取消或要求生成这项信息。其结构如下表:
  • LocalVariableTable属性:用于描述栈帧中局部变量表中的变量与Java源码中定义的变量之间的关系,它不是运行必需的属性,默认也不会生成到Class文件中,可在Javac中使用-g:none或-g:vars选项来取消或要求生成这个选项。没有该选项最大的影响是当其他人引用这个方法时,所有的参数名称都将丢失,IDE可能会使用诸如arg0、arg1之类的占位符来代替原有的参数名,这对程序运行没有影响,但不便于编码,且在调试时无法根据参数名称从上下文中获得参数值。LocalVariableTable属性结构如下:
  • SourceFile属性:用于记录生成这个Class文件的源码文件的名称,它也是可选的,可使用javac的-g:none或-g:source选项来取消或要求生成这个选项。其结构图如下表所示:
  • ConstantValue属性:其作用是通知虚拟机自动为静态变量赋值,且只有被static关键字修饰的变量(类变量)才可以使用这项属性。对于非static变量的赋值是在构造器<init>方法中进行的,而对于类变量则有两种不同的方式可以选择:赋值在类构造器<clinit>方法中进行,或使用ConstantValue属性来赋值。目前Sun Javac编译器的选择是:若同时使用final和static来修饰一个变量,且变量类型是基本类型或java.lang.String的话,就生成ConstantValue属性来进行初始化,若没有final修饰,或并非基本类型及字符串,则选择在<clinit>方法中进行初始化。其结构如下表:
  • InnerClass属性:用于记录内部类和宿主类之间的关联。若一个类中定义内部类,那编译器将会为它及它所包含的内部类生成InnerClass属性,其结构如下:
  • Deprecated及Synthetic属性:都属于标志类型的布尔属性,只存在有和没有的区别,没有属性值的概念。Deprecated属性用于表示某个类、字段或方法,已经被程序作者定为不再推荐使用,它可通过在代码中使用@deprecated注释进行设置。Synthetic属性代表此字段或方法并不是由Java源代码直接产生的,而是由编译器自动添加的。两者的结构如下表所示:
          

6.3   类文件结构
        
      自java诞生至今的十多年里,Java技术体系发生了翻天覆地的变化,相对于语言、API与Java技术体系中其他方面的变化,Class文件结构一直处于一个相对比较稳定的状态,Class文件的主体结构几乎没有发生过变化,对Class文件格式的改进都集中在想访问标志、属性表这些在设计上本就可扩展的数据结构中添加内容。在JDK1.5与JDK1.6中添加的属性的详情如下表:


  核心内容出处:《深入理解Java虚拟机:JVM高级特性与最佳实践》

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值