JVM入门之classfile解析

一、前言

java文件运行后会自动编译生成class文件,这个文件呗成为classfile,存储格式类似于C语言。它是由8个字节为单位的二进制流组成的文件,各个数据紧密排列,没有分隔符。使得class文件几乎全都是程序式运行。

我们常用来查看classfile文件的工具:
Sublime_Text-----和------idea中的插件Bined
在这里插入图片描述

二、class文件解析

    因为是类似C语言的结构存储形式,所以只拥有2中数据结类型:无符号数

1.无符号数

无符号数:
属于基本数据类型 主要用于描述数字 索引符号 数量值 或者按照UTF-8编码构成的字符串值
数据类型 U1 U2 U4 U8 也只是逻辑上的区分。

u1 —表示一个字节----------u2 —表示两个字节
u4 —表示四个字节----------u8 —表示八个字节

2.表

由多个无符号数或者其他表作为数据项构成的复合数据类型,所有的表都习惯以_info结尾 表主要用于描述有层次关系的复合结构数据。 比如 方法、字段 需要注意的是class文件没有分隔符,整个Class文件本质上就是一张表,如下所示:在这里插入图片描述

3.魔术

1 .每一个class文件的头4个字节 被称为魔数 magicNumber

2 . 唯一作用是用于确定这个文件是否为一个能被虚拟机接受的class文件

Class文件魔数值为0xCAFEBABE 如果以个文件不是以CAFEBABE开头,那么它就肯定不是java的class文件。
那么它也是java.class的识别魔数。

很多的文件存储标准中都使用魔数来识别文件的身份。 譬如图片格式.gif 或 jpeg等在文件的头部都存有魔数,使用魔数而不是文件的扩展名称来判断 ,这种情况是处于安全的考虑。因为文件的后缀可以更改,但对魔术的更改相对困难,所以出于安全检测而言魔术检测更为安全。

4.class文件版本号

紧挨着魔数的4个字节表示class的文件的版本号 版本号:
1.次版本号 --minor_version 前2个字节用于表示次版本号
例如:00 00
2.主版本号 --major_version 后2个字节用于表示主版本号
例如: 00 34

这个版本号随在这里插入图片描述

着jdk版本的不同而表示不同版本的范围。Java的版本号是从45开始的
如果class的版本号超过虚拟机的版本 会被拒绝执行,一下是一些JDK对应的版本号:

JDK1.2 ----0X002E 46
JDK1.3 ----0X002F 47
JDK1.4 ----0X0030 48
JDK1.5 ----0X0031 49
JDK1.6 ----0X0032 50
JDK1.7 ----0X0033 51
JDK1.8 ----0X0034 52

5.常量池

紧跟着魔数与版本号之后的是常量池入口,常量池简单理解为class文件的资源库。
1.它是class文件结构中与其他项目关联最多的数据类型
2.是占用class文件空间最大的数据项目之一
3.是在文件中第一个出现的表类型数据项目。

onstant_pool_count(常量的个数)
class文件结构中只有常量池的容量计数是从1开始的。第0项腾出来满足后面某些指向常量池的索引值的数据,在特定的情况下需要表达“不引用任何一个常量池项目” 把索引值的第0项留给JVM自己用。
在这里插入图片描述
从表可知其是1个U2的数据。所以0x22转为10进制减去第0项得出33个常量池

onstant_pool常量池
在这里插入图片描述

常量池中主要存放两大类常量:
1.字面量: 比较接近java语言层面的常量的概念 比如 字符串 被final关键字声明的常量值。
2.符号引用: 属于编译原理方面的概念 包括三项:

类和接口的全名
字段的名称和描述符
方法的名称和描述符
在加载class文件的时候 是进行动态连接的。在class文件中不会保存各个方法和字段的最终内存布局信息。(需要经过转换) 当虚拟机运行时 需要从常量池获得对应的符号引用,再在类创建时或者运行时解析并翻译到具体的内存地址中。

CONSTANT_POOL 表示的是类型数据集合,在该常量池中,每一项常量都是一个表 共有14种 -----JDK1.7版本,这14种结构的表都是不相同的结构数据。14个表都有一共同的特点,都是由u1的标志位开始的,可以通过这个标志位来判断这个常量属于哪种常量的类型。
在这里插入图片描述

常量池详细解析常量类型
总共有18个编号的常量类型。

编号1: CONSTANT_UTF8_INFO

TAG1 ------占用一个空间字节

Length: utf-8字符串占用的字节数

Bytes 长度为length字符串

用于表示utf-8的编码的字符串

编号3 CONSTANT_integer_info

Tag3

Bytes 4个字节 Big_Endian(高位在前) 存储int类型的值

编号4 CONSTANT_float_info

Tag4

Bytes 4个字节 Big_Endian(高位在前) 存储float类型的值

编号5 CONSTANT_long_info

Tag5

Bytes 8个字节 Big_Endian(高位在前) 存储long类型的值

编号6 CONSTANT_double_info

Tag6

Bytes 8个字节 Big_Endian(高位在前) 存储double类型的值

编号7 CONSTANT_Class_info

Tag7

Index 2个字节 指向类的全限定名的项的索引

类和接口符号引用

编号8 CONSTANT_String_info

Tag8

Index 2个字节 指向字符串的字面量的索引

编号9 CONSTANT_Fieldref_info

Tag9

Index 2个字节 指向声明字段的类或接口的描述符 CONSTANT_Class_info的索引项

Index 2个字节 指向字段描述符CONSTANT_NameAndType的索引项

字段的符号引用

编号10 CONSTANT_Methodref_info

Tag10

Index 2个字节 指向声明字段的类或接口的描述符 CONSTANT_Class_info的索引项

Index 2个字节 指向字段描述符CONSTANT_NameAndType的索引项

类中方法的符号引用

编号11 CONSTANT_InterfaceMethodref_info

Tag11

Index 2个字节 指向声明字段的类或接口的描述符 CONSTANT_Class_info的索引项

Index 2个字节 指向字段描述符CONSTANT_NameAndType的索引项

接口中方法的符号引用

编号12 CONSTANT_NameAndType

Tag12

Index 2个字节 指向该字段或方法名称常量项的索引
Index 2个字节 指向该字段或方法描述符常量项的索引

字段或方法的符号引用

编号15 CONSTANT_MethodHandler_info

Tag15

Reference_kind 1个字节 1-9之间的一个值 决定了方法句柄的类型。方法句柄类型的值表示方法句柄的字节码行为

Reference_index 2个字节 对常量池的有效索引。

表示方法句柄

编号16 CONSTANT_MethodType_info

Tag16

Descriptor_index 2个字节 指向UTF8_info 结构表示的方法描述符

编号18CONSTANT_InvokeDynamic_info

Tag18

Bootstrap_method_attr_index: 2个字节 当前class文件中引导方法表的bootstrap_methods[] 数组的有效索引

Name_and_type_index: 2个字节 指向NameAndType_info 表示方法名和方法描述符。

表示动态方法的调用点。

6.access_flag(类的访问控制权限)

在这里插入图片描述

用于表示对该类或接口的访问权限以及该类或接口的属性
在这里插入图片描述

7.this_class

在这里插入图片描述

该this_class 项目的值 必须是constant_pool表中的有效索引,该constant_pool索引处的条目必须是表示此文件定义的类或接口 CONSTANT_Class_info 结构class

8.super_class

在这里插入图片描述

必须是constant_pool表中的有效索引, 如果super_class的值不为0 则constant_pool中的条目必须为CONSTANT_Class_info 结构 这个结构表示此类的文件定义的类的直接超类。直接超类不能在其classfile结构的access_flag项中设置 ACC_FINAL 标志。
其实要描述的意思就是说 如果superclass指代的超类,那么它就不能被final修饰。

8.JClasslib

在这里插入图片描述
安装失败的话可以从官网下载进行本地导入
在这里插入图片描述

9.intefaces_count和 intefaces

intefaces_count表示的接口的数量,两个字节
intefaces 表示接口名,两个字节

10.fields_count 和 fields

fields_count表示域的数量,两个字节
fields 表示域的表
1.名称access_flag 类型u2 数量1个
2.名称 name_index 类型u2 数量1个 -
3. 名称 descriptior_index 类型u2 数量1个
4. 名称 descriptior_index 类型u2 数量1个
(1) 参数列表(参数类型) 后-返回值
(2) void m() 等同于 ()V
(3) String toString() ->()Ljava/lang/String;
(4) Long pos(int[] arr1,int arr2,long length) ->([IIJ)J
[ 一维数组
[[ 表示二维数组
(5)attributes_count 附加属性的数量
(6)attributes 附加属性
在这里插入图片描述

11.method_count(方法的数量) 和 method(方法表)

1.名称access_flag 类型u2 数量1个
2.名称 name_index 类型u2 数量1个 -
3. 名称 descriptior_index 类型u2 数量1个
4. 名称 descriptior_index 类型u2 数量1个
(1) 参数列表(参数类型) 后-返回值
(2) void m() 等同于 ()V
(3) String toString() ->()Ljava/lang/String;
(4) Long pos(int[] arr1,int arr2,long length) ->([IIJ)J
[ 一维数组 [[ 表示二维数组
(5)attributes_count 附加属性的数量
(6)attributes 附加属性

12.attribute_count 和 attribute

attribute_count 表示附加的属性数量 两个字节
attribute 表示附加属性表
附加属性 方法中的附加属性就是code,那么code在这里是比较重要的概念,code是具体代码的实现,当我们写入方法的时候,它能够把方法中代码转化为一条条指令。
在这里插入图片描述

Attributes附加属性
附加属性中 有的代码中存在内容,有的不存在内容
1.既有预定义的属性,也可以自定义 java虚拟机会自动忽略它不认识属性
2. Code 表示的是方法表 方法表能够编译成字节码指令,还存放了操作数栈和局部变量的信息
在这里插入图片描述
u2 attribute_name_index 指向常量池中的CONSTANT_UTF8_info 存放的当前属性的名字就是code。
u4 attribute_length 表示的code属性的长度 (不包括前6个字节)。
u2 max_stack 指定当前方法被执行引擎执行的时候,在栈帧中需要分配的操作数栈的大小
u2 max_locals 指定当前方法被执行引擎执行的时候,在栈帧中需要分配的局部变量表的大小
u4 code_length 指定方法字节码的长度, class文件中每条字节码都占用一个字节
u1 code 存放字节码指令本身,它的长度是code_length个字节。
U2 exception_table_length指定异常表的大小
Exception_table异常表 作用对try-catch-finally的描述,可以把它看成是一个数组。每一个数组项都是一个exception_info结构, 一般来说每个catch块对应一个exception_info,编译器也可能会对当前的方法生成一些exception_info.
在这里插入图片描述

u2 start_pc 是从字节码code属性中的一部分 起始处到当前异常处理器的起始处的偏移量量

u2 end_pc 从字节码起始处到当前异常处理器 末尾的偏移量

u2 handler_pc 是指当前异常处理器用于处理异常(即catch块)的第一条指令相对于字节码开始处的偏移量。

u2 catch_type 是常量池的索引 指向的是常量池CONSTANT-Class_info 数据项,描述了catch块中的异常类型的信息。这个类必须是java.lang.Throwable的或者是它的子类。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值