Java程序的执行过程引发的思考

Java程序的执行过程

.class文件

Java不会生成.exe执行程序,而是通过生成JVM可读入的.class文件

跨平台语言

.class文件格式是一样的,在不同的操作系统有着对用的JVM,从而说ava语言是跨平台的

如下图:
在这里插入图片描述

问题1:如果让你来设计class文件的结构,怎么 做?
想必同我一样是一头雾水,我们先了解一下class文件是
  • Class文件是一组以8字节为基础单位的二进制流
  • 各个数据项目严格按照顺序紧凑排列在class文件中,
  • 中间没有分隔符,这使得class文件中存储的内容几乎是全部程序运行的程序

Java虚拟机规范规定,Class文件格式采用类似C语言结构体的伪结构来存储数据,这种结构只有两种数据类型:无符号数

数据类型
无符号数:

顾名思义是不带符号的数,描述数字、索引符号、数量值或者按照UTF-8编码构成的字符串值,大小使用u1、u2、u4、u8分别表示1字节、2字节、4字节和8字节

表:

由多个无符号数或者其他表作为数据项构成的复合数据类型,主要用于描述有层次关系的复合结构的数据,比如方法、字段。

构成

1.魔数

每个Class文件的头4个字节称为魔数,用于确认是否是可被JVM接收的class文件,值为0xCAFEBABE

2.版本号

紧接着魔数的4个字节是Class文件版本号,不同的版本号对应不同的jdk版本,必须要低于JVM的版本

3.常量池(静态常量池

常量池是为了避免频繁的创建和销毁对象造成系统性能的浪费,实现了对象的共享。

主要存放两大类常量:

  1. 字面量: 比较接近于Java语言层面的常量概念,如文本字符串、被声明为final的常量值等
  2. 符号引用: 属于编译原理方面的概念,包括了下面三类常量:
    • ​ 类和接口的全限定名
    • 字段的名称和描述符
    • 方法的名称和描述符

区别于JVM常量池(运行时常量池

​ JVM虚拟机在完成类装载操作后,将class文件中的常量池载入到内存中,并保存在方法区中,我们常说的常量池,就是指方法区中的运行时常量池,除了class文件内的符号引用外,还会把符号引用翻译出来的直接引用放在运行时常量池中(称为动态链接,发生在类加载的解析阶段)

动态性:运行期间可以将新的常量放入到运行时常量池,String的intern()方法

4.访问标志(access_flags)

​ 2字节,这个标志主要用于识别一些类或接口层次的访问信息,主要包括:

  • 是否final
  • 是否public,否则是private
  • 是否是接口
  • 是否可用invokespecial字节码指令
  • 是否是abstact
  • 是否是注解
  • 是否是枚举类型

5.类索引、父类索引、接口索引集合

  • 类索引(this_class),用于确定这个类的全限定名,占2字节

  • 父类索引(super_class),用于确定这个类父类的全限定名(Java语言不允许多重继承,故父类索引只有一个。除了java.lang.Object类之外所有类都有父类,故除了java.lang.Object类之外,所有类该字段值都不为0),占2字节

  • 接口索引计数器(interfaces_count),占2字节。如果该类没有实现任何接口,则该计数器值为0,并且后面的接口的索引集合将不占用任何字节,

  • 接口索引集合(interfaces),一组u2类型数据的集合。用来描述这个类实现了哪些接口,这些被实现的接口将按implements语句(如果该类本身为接口,则为extends语句)后的接口顺序从左至右排列在接口的索引集合中

    this_class、super_class与interfaces按顺序排列在访问标志之后,它们中保存的索引值均指向常量池中一个CONSTANT_Class_info类型的常量,通过这个常量中保存的索引值可以找到定义在CONSTANT_Utf8_info类型的常量中的全限定名字符串,Class文件中由这三项数据来确定这个类的继承关系

6、字段表集合

格式:依次是访问标志(access_flags)、名称索引(name_index)、描述符索引(descriptor_index)、属性表集合(attributes)

img

字段表(field_info)用于描述接口或类中声明的字段。字段(field)包括类级变量和实例级变量,但不包括在方法内部声明的局部变量。

字段修饰符放在access_flags项目中,它与类中的access_flags项目是非常类似的,都是一个u2的数据类型

在access_flags标志后的是两项索引值:name_index和descriptor_index。它们都是对常量池的引用,分别代表着字段的简单名称以及字段和方法的描述符。

7、方法表集合

Class文件存储格式中对方法的描述与对字段的描述几乎采用了完全一致的方式,方法表的字段同字段表的一样

8、属性表集合

在Class文件中字段表、方法表都可以携带自己的属性表集合,用于描述某些场景的专有信息。属性表中不要求各个属性表具有严格的顺序,只要不与已有属性重名即可。对于每个属性,它的名称需要从常量池中引用一个CONSTANT_Utf8_info类型的常量来表示,格式自己定义(用一个u4描述长度即可)

了解至此我们知道class文件其实就是对Java程序的一种转换,其目的是为JVM提供可读入的信息来源,从而达到Java语言的跨平台特性

我们自己设计的话要考虑到以下几点

  1. 文件类型----魔数,说明是一个Java程序的class文件,而不是由别的文件修改后缀名得到
  2. 环境----版本,Java程序的运行需要jdk环境支持,版本号不能高于JVM版本
  3. 如何描述一个类(字段,方法,属性什么什么的)
  4. 如何描述类之间的关系(父类,子类,继承什么什么的)
  5. 为了减少复杂的声明是不是还需要一个常量表呀

(知道了这些是不是可以跟面试官聊下去了呢-。-)

问题2:JVM怎么加载类的?

类加载机制:JVM把描述类的数据从 Class 文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的 Java 类型

类加载过程:类加载–> 验证–> 准备–> 解析–> 初始化

说一下加载阶段和解析阶段,涉及Java语言的动态性(动态加载)(动态连接)

加载分为三步:

  1. 通过一个类的全限定名获取定义此类的二进制流
  2. 将静态存储结构转化为方法去的运行时存储结构
  3. 在堆中生成一个java.lang.Class文件作为访问接口

在第一步中并没有指定二进制字节流必须要从Class文件获取,所以开发人员可以使用自定义的类加载器去控制字节流的获取方式(重写一个加载器的findClass() 或者loadClass()方法),可以在程序运行时从网络或者其他地方加载二进制字节流作为程序代码的一部分,称之为显示加载,是动态加载的一部分。

解析:Java虚拟机将常量池内的符号引用转化为直接引用的过程

符号引用:可以是任意形式的字面量,只要可以无歧义定义到目标即可

直接引用:是可以直接指向目标的指针、相对偏移量或者是句柄

码的一部分,称之为显示加载,是动态加载的一部分。

解析:Java虚拟机将常量池内的符号引用转化为直接引用的过程

符号引用:可以是任意形式的字面量,只要可以无歧义定义到目标即可

直接引用:是可以直接指向目标的指针、相对偏移量或者是句柄

参考:Class类文件结构

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值