Class类文件的结构与语言无关

无关性的基石

**与平台无关的实现:**Sun公司以及其他的虚拟机提供商发布了许多可以运行在各种不同平台上的虚拟机,这些虚拟机都可以载入和执行同一种平台无关的字节码,从而实现了程序的“一次编写,到处运行”。

实现语言无关性的基础是虚拟机和字节码存储格式。Java虚拟机不和包括Java在内的任何语言绑定,它只与Class文件这种特定的二进制文件格式所关联,Class文件中包含了Java虚拟机指令集和符号表以及若干其他辅助信息。

作为一个通用的、机器无关的执行平台,任何其他语言的实现者都可以将Java虚拟机作为语言的产品交付媒介。例如,使用Java编译器(javac工具)可以把Java代码编译为存储字节码的Class文件,使用JRuby等其他编译器可以把代码编译为Class文件,虚拟机并不关心Class的来源是何种语言。
这里写图片描述

Class类文件的结构

Class文件是一组以8位字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑的排列在Class文件中,中间没有添加任何分隔符,这使得整个Class文件中存储的内容几乎全部是程序运行的必要数据,没有空隙存在。

魔数与Class文件的版本

每个Class文件的头4个字节称为魔数(Magic Number),其唯一作用是确定这个文件是否为一个能被虚拟机接受的Class文件。值为0xCAFEBABE。

紧接着魔数的4个字节存储的是Class的版本号:第5个和第6个字节是次版本号(Minor Version),第7个和第8个字节是主版本号(Major Version)。高版本的JDK只能向下兼容以前版本的Class文件,不能运行以后版本的Class文件。

常量池

紧接着主次版本号的是常量池,也可以理解为Class文件的资源仓库,它是与其他项目关联最多的数据类型,也是占用Class文件空间最大的数据项目之一,同时还算第一个出现的标类型数据项目。

由于常量池中常量数量不固定,因此在入口处要放置一项u2(代表两个字节)类型的数据,代表常量池计数值(从1开始),因为计数的0代表“不引用任何一个常量池项目”的含义。

常量池中主要存放两大类常量:字面量(Literal)和符号引用(Symbolic References)。字面量比较接近于Java语言层面的常量概念,如文本字符串、声明为final的常量值等。符号引用则属于编译原理方面的概念,包括下面三类常量:

  • 类和接口的全限定名(Fully Qualified Name)
  • 字段的名称和描述符(Descriptor)
  • 方法的名称和描述符
    • 全限定名:包括完整包信息的限定名,例如”org/fenixsoft/clazz/TestClass”,
      为了使多个全限定名之间不混淆,使用时最后一般加入一个”;”,表示全限定名结束。
    • 简单名称:没有类型和参数修饰的方法或者字段名称,如:”inc()”方法和”m”变量。
    • 相对于以上二者,方法和字段的描述符比较复杂一些,描述符的作用是用来描述字段的数据类型、方法的参数列表(包括数量、类型和顺序)和返回值。根据描述符规则,基本数据类型以及代表无返回值的void类型都用一个大写字符表示,而对象类型就用字符L加对象的全限定名来表示。对于数组,每一个维度前面加一个”[“来描述,例如”String[][]”类型的二位数组,则被记录为:”[[Ljava/lang/String;”,一个”int[]”将被记录为:”[I”。而方法的描述符,按照先参数列表,后返回值的顺序描述,参数列表按照参数的严格顺序放在一组小括号”()”之内。方法int indexOf(char[] source, int sourceOffset, int target)的描述为”([CII)I”。
      这里写图片描述

java代码在javac编译的时候,并没有连接这一步骤,而是在虚拟机加载Class文件的时候动态连接。即Class文件中不会保存各个方法、字段的最终布局信息,因此这些字段、方法的符号引用不经过运行期转换的话无法得到真正的内存入口地址,也就无法直接被虚拟机使用。当虚拟机运行时,需要从常量池中获得对应的符号引用,再在类创建时或运行时解析、翻译到具体的内存地址中。

访问标志

紧接着的两个字节代表访问标志(access_flags),用于识别一些类或接口层次的访问信息,包括:这个Class是类还是接口;是否为public类型;是否定义为abstrct类型;如果是类,是否被声明为final等。
这里写图片描述

类索引、父类索引与接口索引集合

类索引(this_class)和父类索引(super_class)都是一个u2类型的数据(类索引在前),而接口索引集合(因为接口可以有多个)是一组u2类型的数据的集合(其中第一个u2数据为接口计数器,没有接口则为0),Class文件中由这三项数据确定这个类的继承关系。由于Object是所有类的父类,因此除了Object,其余类的父类索引都不为0。

字段表集合

字段表用于描述接口或类中声明的变量。字段包括类级变量以及实例级变量,但不包括在方法内部声明的局部变量。字段包括的信息有:字段的作用域(public、private等修饰符)、是实例变量还是类变量(是否有static)、可变性(final)、并发可见性(volatile修饰符)、是否可被序列化(transient)、字段数据类型(基本类型、数组、对象)、字段名称。
这里写图片描述
上诉的信息,除了字段名称外,都属于access_flags的内容,紧随其后的是name_index和descriptor_index,它们都是对常量池的引用,分别代表字段的简单名称以及字段和方法的描述符。到此为止,字段表的固定数据项目截止了,不过之后要跟随这一个属性表用于存储一些额外的信息。

方法表集合

对方法的描述与对方法的描述与对字段的描述几乎完全一致,方法表的结构依次包括了访问标志(access_flahs)、名称索引(name_index)、描述符索引(descriptor_index)和属性表集合(attributes)几项。
这里写图片描述

到此为止,方法的定义可以通过访问标志、名称索引、描述符索引(描述方法的定义等)表达清楚,但是其中的Java代码呢?代码被编译器编译成字节码指令后,存放在方法属性表中一个名为”Code”的属性里面。属性表的内容如下:

属性表集合

属性表(attribute info)在Class文件、字段表、方法表都可以携带自己的属性表集合,以用于描述某些场景专有的信息。

Code属性

Java程序方法体中的代码经过javac编译器处理后,最终变为字节码指令存储在Code属性内。Code属性出现在方法表的属性列表中,但接口或者抽象类中就不存在Code属性。

Code属性是Class文件中最重要的一个属性,如果吧一个Java程序中的信息分为代码(Code,方法体里的Java代码)和元数据(Metadata,包括类、字段、方法定义和其他信息)两部分。那么在整个Class文件中,Code属性用于描述代码,其他所有的数据项目都用于描述元数据。

Exceptions属性

是在属性表中与Code同级的一项属性。其作用是列举出方法可能抛出的受查异常(Checked Exceptions),也就是方法描述时在throws关键字后面列举的异常。

LineNumberTable属性

用于描述Java源码行号与字节码行号(字节码的偏移量)之间的对应关系。它并不是运行时必须的属性,但默认会生成到Class文件中。

LocalVariableTable属性

用于描述栈帧中局部变量表中的变量与Java源码中定义的变量之间的关系,它并不是运行时必须的属性,但默认会生成到Class文件中。

SourceFile属性

用于记录生成这个Class文件的源码文件名称,也是可选的属性。

ConstantValue属性

通知虚拟机自动为静态变量赋值。只有被static关键字修饰的变量(类变量)才可以使用这项属性。对于非static类型的变量(也就是实例变量)的赋值是在实例构造器<init>方法(第10长内容)中进行的;而对于类变量,有两种方法:在类构造器<clinit>方法中或使用ConstantValue属性。

如果同时使用使用final和static来修饰一个变量,并且这个变量是基本数据类型或String,则生成ConstantValue属性来进行初始化,否则都在<clinit>方法中进行初始化。

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Java虚拟机的结构主要由加载器、虚拟机栈、本地方法栈、堆、方法区组成。加载器的作用是加载Java;虚拟机栈是用于存储局部变量、操作数栈等信息;本地方法栈是用于存储本地方法的栈;堆是Java虚拟机使用的最大内存空间,用于存储对象实例;而方法区则存放信息、常量、静态变量等数据。 ### 回答2: Java虚拟机(Java Virtual Machine,JVM)是Java程序的运行环境,它在物理机器上创建一个虚拟的计算机平台,在这个平台上执行Java字节码。JVM的结构包含以下几个关键组成部分: 1. 加载器(ClassLoader):负责加载字节码文件(.class文件)并将其转换为Java的内存表示。加载器可以根据需要动态加载和卸载。 2. 执行引擎(Execution Engine):负责执行Java字节码。执行引擎将字节码解释为机器指令序列或将其编译为本地代码执行,以达到提高性能的目的。 3. 运行时数据区(Runtime Data Areas):包括多个不同型的数据区域,用于存储程序运行所需的数据。 - 方法区(Method Area):存储被加载的信息、常量、静态变量、即时编译器编译后的代码等。 - 堆(Heap):存储Java对象实例,堆是在JVM启动时创建的,用于存放动态分配的对象。 - 栈(Stack):存储方法执行时的局部变量、操作数栈、调用信息等。每个线程都有自己的栈,用于方法的调用和返回。 - 程序计数器(Program Counter Register):记录当前线程执行的指令地址或指令索引。 4. 本地方法接口(Native Method Interface,JNI):允许Java应用程序调用使用其他语言编写的本地库中的方法。 5. 安全性引擎(Security Engine):提供安全管理和访问控制功能,确保Java程序在执行时具有必要的权限。 这些组成部分共同构成了Java虚拟机的结构Java程序在JVM上运行时,通过加载器将程序转化为内存表示,在运行时数据区执行代码,执行引擎解释和执行字节码指令,最终完成Java程序的运行。JVM的结构和功能的设计有效地将Java程序的开发与底层的操作系统解耦,提供了跨平台的能力。 ### 回答3: Java虚拟机(JVM)是Java程序的运行环境,它是一个软件程序,能够解释和执行Java字节码。JVM的结构可以分为以下几个部分: 1. 加载器(Class Loader):加载器负责加载Java文件,将其加载到内存中,并生成对应的对象。JVM中有三个主要的加载器:启动加载器(Bootstrap Class Loader)、扩展加载器(Extension Class Loader)和应用程序加载器(Application Class Loader)。 2. 运行时数据区(Runtime Data Area):运行时数据区是JVM用于存储程序运行时所需数据的区域。主要包括方法区、堆、虚拟机栈、本地方法栈和程序计数器。 - 方法区(Method Area):用于存储结构信息、静态变量、常量等数据。 - 堆(Heap):用于存储Java对象。所有的对象实例都分配在堆中,并可以通过引用在方法区或栈中访问。 - 虚拟机栈(VM Stack):每个线程在运行时都会创建一个对应的虚拟机栈,用于存储局部变量、方法参数、返回值等。 - 本地方法栈(Native Method Stack):与虚拟机栈似,但用于执行本地方法。 - 程序计数器(Program Counter):用于记录当前线程执行的字节码指令地址。 3. 执行引擎(Execution Engine):执行引擎负责解释和执行字节码指令,将其转换为对应的机器指令。常见的执行引擎有两种:解释器(Interpreter)和即时编译器(Just-In-Time Compiler,JIT)。 4. 本地方法接口(Native Interface):本地方法接口提供了Java代码调用本地方法的能力。本地方法接口定义了一组规范,使得Java代码可以与C、C++等底层语言进行交互。 5. 垃圾回收系统(Garbage Collection System):垃圾回收系统负责自动管理堆内存的分配和释放,回收不再使用的对象。垃圾回收系统通过标记-清除、复制算法等方式来回收内存。 通过以上的结构Java虚拟机能够提供一种平台无关的执行环境,使得Java程序在不同的操作系统和硬件平台上都能够运行。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值