JVM Knowleadge-字节码文件的构造

本文参考了周志明的《深入理解Java虚拟机:JVM高级特性与最佳实践》,这本书写的非常好!极力推荐!

字节码平台无关性:

Java的一次编译到处运行即要求所载入的和执行同一种平台无关的字节码。各个平台的虚拟机与所有平台都统一采用字节码(ByteCode)存储格式。


有很多语言可以在JVM上执行。而语言无关性的基础是:JVM和字节码存储格式。

JVM不关心Class的来源是什么语言,之后要它符合Class文件应有的结构就可以在JVM上执行。


使用命令获取的一个字节码阅读文件:

使用Javap-verbose xxx.class命令得到的一个结果



字节码文件组成:


构成细节如下:

Java语言中的各种变量,关键字和运算符号的语义最终都是由多条字节码命令组合而成的。

  1. Class文件是以8位字节为基础单位的二进制流。

    1. 各个数据项按照顺序紧密排列在Class文件之中,中间没有添加任何分隔符。

    2. 8位以上的数据项会分割成若干个8位字节进行存储。

  2. Class文件格式采用类似于C语言结构体的伪结构来存储。这种伪结构只有两种类型的数据类型:无符号数和表。

    1. 无符号数

      1. 属于基本数据类型,以u1,u2,u4,u8来分别代表1个字节,2个字节,4个字节,8个字节的无符号数。

      2. 用来描述数字,索引引用,数量值,或者UTF-8编码的字符串值。

      1. 由多个无符号数或者其他表作为数据项构成的符合数据类型。

      2. 习惯用_info结尾。

      3. 用来描述有层次关系的复合结构的数据。整个Class文件实质上就是一张表。

    2. 无论无符号数还是表,当需要描述同一类型但数量不定的多个数据时,经常会使用一个前置的容量计数器+若干个连续的数据项形式。

  1. Class文件构成细节

  1. MagicNumber:每个Class文件的u4称为MagicNumber,它的唯一作用是用来确定文件类型。

  1. Class文件的版本号:紧跟着MagicNumberu4Class文件的版本编号。

  2. 常量池

    1. 版本号后面的是常量池的入口。

    2. 常量池与其他项目关联最多,占用空间较大。

    3. 常量池的数量通常是不固定的。所以常量池的入口需要放置一个u2类型的数据,代表常量池的容量计数器。

    4. 存储两类常量:

      1. 字面量(Literal):文本字符串,final的常量值等。

      2. 符号引用(SymbolicReferences)

        1. 类和接口的全限定名。

        2. 字段的名称和描述符。

        3. 方法的名称和描述符。

注意:在Class文件中不会保存各个方法和字段的最终内存布局,而是符号引用。


    1. 常量池中每一项常量都是一个表,共有11种不同的的表结构。

      1. CONSTANT_Utf8_info(utf-8编码的字符串)

      2. CONSTANT_Integer_info

      3. CONSTANT_Float_info

      4. CONSTANT_Long_info

      5. CONSTANT_Double_info

      6. CONSTANT_Class_info(类或接口的符号引用)

      7. CONSTANT_String_info(字符串类型字面量)

      8. CONSTANT_Fieldref_info(字段的符号引用)

      9. CONSTANT_Methodref_info(类中方法的符号引用)

      10. CONSTANT_InterfaceMethodref_info(接口中方法的符号引用)

      11. CONSTANT_NameAndType_info(字段或方法的部分符号引用)

    2. 11种表中开始的第一位是一个u1类型的标志位,代表当前这个常量属于那种类型的。

    3. Class文件中方法,字段都需要引用CONSTANT_Utf8_info常量来表示名称。

    4. 使用Javap-verbose xxx.class命令可以字节码内容。


  1. 常量池结束以后,紧跟着2个字节的访问标志(access_flags),这个标志用来识别一些类或接口层次的访问信息。

    1. ACC_PUBLIC:是否为public类型

    2. ACC_FINAL:是否被声明为final

    3. ACC_SUPERJDK1.2之后,这个值为真


    1. ACC_INTERFACE:标识这是一个接口

    2. ACC_ABSTRACT:是否为abstract,对于抽象类或接口来说,此值为真


    1. ACC_SYNTHETIC:标识这个类并非由用户代码产生。

    2. ACC_ANNOTION:标识这是一个注解

    3. ACC_ENUM:标识这是一个枚举

  1. 类索引(this_class),父类索引(super_class),接口索引(interfaces)集合

    1. 这些数据项位于access_flags之后。

    2. Class文件由这三项数据来确定这个类的继承关系。

    3. 类索引用于确定这个类的全限定名,父类索引用于确定这个类的父类的全限定名。

    4. Interfaces是一个集合,因为一个类可实现多个接口。

    5. 除了java.lang.Object之外,所有的java类的父类索引都不为0

    6. 对于索引集合,入口的第一项为该索引表的容量(代表实现接口的数量)。

  2. 字段表(filed_info)

    1. 用于描述接口类或类中声明的变量。

    2. Filed包括static和非static的。

    3. Filed不包括局部变量。

    4. Field信息:

      1. 作用域(private,protected,default,public)

      2. StaicorStatic

      3. 可变性final

      4. 并发可见性(volatile)

      5. 可否序列化(transient)

      6. 字段的数据类型(基本类型,对象,数组),字段名称。


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值