java类解析目的将常量池_《Java虚拟机原理图解》 1.2.2、Class文件里的常量池具体解释(上)...

[last updated:2014/11/27]

NO1.常量池在class文件的什么位置?

我的上一篇文章《Java虚拟机原理图解》 1、class文件基本组织结构中已经提到了class的文件结构,在class文件里的魔数、副版本号号、主版本号之后,紧接着就是常量池的数据区域了,例如以下图用红线包含的位置:

b57f5fc12df1da936f14809bf3daf226.png

知道了常量池的位置后,然后让我们来揭秘常量池里到底有什么东西吧~

NO2.常量池的里面是怎么组织的?

常量池的组织非常easy,前端的两个字节占有的位置叫做常量池计数器(constant_pool_count),它记录着常量池的组成元素  常量池项(cp_info)

的个数。紧接着会排列着constant_pool_count-1个常量池项(cp_info)。例如以下图所看到的:

762c8707f1768b168d006b17d180efbd.png

NO3.常量池项 (cp_info) 的结构是什么?

每一个常量池项(cp_info)

都会相应记录着class文件里的某中类型的字面量。让我们先来了解一下常量池项(cp_info)的结构吧:

60486d30390885a52bd6447aa66b381f.png

JVM虚拟机规定了不同的tag值和不同类型的字面量相应关系例如以下:

0348a1c8cb3b445913940ed10efad648.png

所以依据cp_info中的tag 不同的值,能够将cp_info 更细化为下面结构体:

CONSTANT_Utf8_info,CONSTANT_Integer_info,CONSTANT_Float_info,CONSTANT_Long_info,

CONSTANT_Double_info,CONSTANT_Class_info,CONSTANT_String_info,CONSTANT_Fieldref_info,

CONSTANT_Methodref_info,CONSTANT_InterfaceMethodref_info,CONSTANT_NameAndType_info,CONSTANT_MethodHandle_info,

CONSTANT_MethodType_info,CONSTANT_InvokeDynamic_info。

3d9e567e91e29ba6279a0b760651956b.png

如今让我们看一下细化了的常量池的结构会是类似下图所看到的的样子:

d77cdf965fd8ebb897001b3a7aa3d70e.png

NO4.常量池可以表示那些信息?

e2834b546c78fdfba580f006e43b3c43.png

NO5. int和float数据类型的常量在常量池中是如何表示和存储的?(CONSTANT_Integer_info,

CONSTANT_Float_info)

Java语言规范规定了int类型和Float 类型的数据类型占用4 个字节的空间。那么存在于class字节码文件里的该类型的常量是怎样存储的呢?对应地,在常量池中,将int和Float类型的常量分别使用CONSTANT_Integer_info和Constant_float_info表示,他们的结构例如以下所看到的:

9656bd04c163873b63b5667e0b836860.png

举例:建以下的类IntAndFloatTest.java,在这个类中,我们声明了五个变量,可是取值就两种int类型的10 和Float类型的11f。

package com.louis.jvm;

public class IntAndFloatTest {

private final int a = 10;

private final int b = 10;

private float c = 11f;

private float d = 11f;

private float e = 11f;

}

然后用编译器编译成IntAndFloatTest.class字节码文件,我们通过javap

-v IntAndFloatTest指令来看一下其常量池中的信息,能够看到尽管我们在代码中写了两次10 和三次11f,可是常量池中,就仅仅有一个常量10 和一个常量11f,例如以下图所看到的:

584cf5caf3c7c7e463c25a7837c85697.png

从结果上能够看到常量池第#8 个常量池项(cp_info) 就是CONSTANT_Integer_info,值为10;第#23个常量池项(cp_info)

就是CONSTANT_Float_info,值为11f。(常量池中其它的东西先别纠结啦,我们会面会一一解说的哦)。

代码中全部用到 int类型10 的地方,会使用指向常量池的指针值#8 定位到第#8 个常量池项(cp_info),即值为10的结构体CONSTANT_Integer_info,而用到float类型的11f时,也会指向常量池的指针值#23来定位到第#23个常量池项(cp_info)

即值为11f的结构体CONSTANT_Float_info。例如以下图所看到的:

a1681788d1c840cc4fce0fd93e11bf9c.png

NO6. long和 double数据类型的常量在常量池中是如何表示和存储的?(CONSTANT_Long_info、CONSTANT_Double_info)

Java语言规范规定了 long类型和 double类型的数据类型占用8 个字节的空间。那么存在于class 字节码文件里的该类型的常量是怎样存储的呢?对应地,在常量池中,将long和double类型的常量分别使用CONSTANT_Long_info和Constant_Double_info表示,他们的结构例如以下所看到的:

2f9a392b1131cc35c7cc94d8dfdc254a.png

举例:建以下的类LongAndDoubleTest.java,在这个类中,我们声明了六个变量,可是取值就两种Long 类型的-6076574518398440533L和Double类型的10.1234567890D。

package com.louis.jvm;

public class LongAndDoubleTest {

private long a = -6076574518398440533L;

private long b = -6076574518398440533L;

private long c = -6076574518398440533L;

private double d = 10.1234567890D;

private double e = 10.1234567890D;

private double f = 10.1234567890D;

}

然后用编译器编译成 LongAndDoubleTest.class字节码文件,我们通过javap -v LongAndDoubleTest指令来看一下其常量池中的信息,能够看到尽管我们在代码中写了三次-6076574518398440533L和三次10.1234567890D,可是常量池中,就仅仅有一个常量-6076574518398440533L和一个常量10.1234567890D,例如以下图所看到的:

b38dc4a953459b7f09b85b04f4dbe9c9.png

从结果上能够看到常量池第 #18 个常量池项(cp_info) 就是CONSTANT_Long_info,值为-6076574518398440533L;第#26个常量池项(cp_info)

就是CONSTANT_Double_info,值为10.1234567890D。(常量池中其它的东西先别纠结啦,我们会面会一一解说的哦)。

代码中全部用到 long 类型-6076574518398440533L的地方,会使用指向常量池的指针值#18 定位到第#18 个常量池项(cp_info),即值为-6076574518398440533L的结构体CONSTANT_Long_info,而用到double类型的10.1234567890D时,也会指向常量池的指针值#26

来定位到第#26 个常量池项(cp_info) 即值为10.1234567890D的结构体CONSTANT_Double_info。例如以下图所看到的:

c5aea92328c3b756c5c17a42881f3dea.png

NO7. String类型的字符串常量在常量池中是如何表示和存储的?(CONSTANT_String_info、CONSTANT_Utf8_info)

对于字符串而言,JVM会将字符串类型的字面量以UTF-8 编码格式存储到在class字节码文件里。这么说可能有点摸不着北,我们先从直观的Java源代码中中出现的用双引號"" 括起来的字符串来看,在编译器编译的时候,都会将这些字符串转换成CONSTANT_String_info结构体,然后放置于常量池中。其结构例如以下所看到的:

d1b45691fbd74991e4a37f6d104aa801.png

如上图所看到的的结构体,CONSTANT_String_info结构体中的string_index的值指向了CONSTANT_Utf8_info结构体,而字符串的utf-8编码数据就在这个结构体之中。例如以下图所看到的:

a76b53b193f29fe71bd35b85393e89e0.png

请看一例,定义一个简单的StringTest.java类,然后在这个类里加一个"JVM原理" 字符串,然后,我们来看看它在class文件里是如何组织的。

package com.louis.jvm;

public class StringTest {

private String s1 = "JVM原理";

private String s2 = "JVM原理";

private String s3 = "JVM原理";

private String s4 = "JVM原理";

}

将Java源代码编译成StringTest.class文件后,在此文件的文件夹下运行javap -v StringTest命令,会看到例如以下的常量池信息的轮廓:

587f172f952b494c4ca17169e3652ece.png

(PS :使用javap -v 指令能看到易于我们阅读的信息,查看真正的字节码文件能够使用HEXWin、NOTEPAD++、UtraEdit 等工具。)

在面的图中,我们能够看到CONSTANT_String_info结构体位于常量池的第#15个索引位置。而存放"Java虚拟机原理"

字符串的 UTF-8编码格式的字节数组被放到CONSTANT_Utf8_info结构体中,该结构体位于常量池的第#16个索引位置。上面的图仅仅是看了个轮廓,让我们再深入地看一下它们的组织吧。请看下图:

18bc0f1381c7d84ab417b3a22af43475.png

由上图可见:“JVM原理”的UTF-8编码的数组是:4A564DE5 8E 9FE7 90 86,而且存入了CONSTANT_Utf8_info结构体中。

NO8. 类文件里定义的类名和类中使用到的类在常量池中是如何被组织和存储的?(CONSTANT_Class_info)

JVM会将某个Java 类中全部使用到了的类的全然限定名 以二进制形式的全然限定名 封装成CONSTANT_Class_info结构体中,然后将其放置到常量池里。CONSTANT_Class_info

的tag值为7 。其结构例如以下:

c86773a982f3a88c0a62d70dc30884d9.png

Tips:类的全然限定名和二进制形式的全然限定名

在某个Java源代码中,我们会使用非常多个类,比方我们定义了一个ClassTest的类,并把它放到com.louis.jvm

包下,则ClassTest类的全然限定名为com.louis.jvm.ClassTest,将JVM编译器将类编译成class文件后,此全然限定名在class文件里,是以二进制形式的全然限定名存储的,即它会把全然限定符的"."换成"/"

,即在class文件里存储的ClassTest类的全然限定名称是"com/louis/jvm/ClassTest"。由于这样的形式的全然限定名是放在了class二进制形式的字节码文件里,所以就称之为 二进制形式的全然限定名。

举例,我们定义一个非常easy的ClassTest类,来看一下常量池是怎么对类的全然限定名进行存储的。

package com.jvm;

import java.util.Date;

public class ClassTest {

private Date date =new Date();

}

将Java源代码编译成ClassTest.class文件后,在此文件的文件夹下运行javap -v ClassTest命令,会看到例如以下的常量池信息的轮廓:

ebc5ea5ad1eac7c4ece0f2fb532c5e3e.png

如上图所看到的,在ClassTest.class文件的常量池中,共同拥有 3 个CONSTANT_Class_info结构体,分别表示ClassTest

中用到的Class信息。 我们就看当中一个表示com/jvm.ClassTest的CONSTANT_Class_info

结构体。它在常量池中的位置是#1,它的name_index值为#2,它指向了常量池的第2 个常量池项,例如以下所看到的:

a342798081d531f88971d3ef01d276ae.png

注意:

对于某个类而言,其class文件里至少要有两个CONSTANT_Class_info常量池项,用来表示自己的类信息和其父类信息。(除了java.lang.Object类除外,其它的不论什么类都会默认继承自java.lang.Object)假设类声明实现了某些接口,那么接口的信息也会生成相应的CONSTANT_Class_info常量池项。

除此之外,假设在类中使用到了其它的类,仅仅有真正使用到了对应的类,JDK编译器才会将类的信息组成CONSTANT_Class_info常量池项放置到常量池中。例如以下图:

package com.louis.jvm;

import java.util.Date;

public class Other{

private Date date;

public Other()

{

Date da;

}

}  上述的Other的类,在JDK将其编译成class文件时,常量池中并没有java.util.Date相应的CONSTANT_Class_info常量池项,为什么呢?

在Other类中尽管定义了Date类型的两个变量date、da,可是JDK编译的时候,觉得你仅仅是声明了“Ljava/util/Date”类型的变量,并没有实际使用到Ljava/util/Date类。将类信息放置到常量池中的目的,是为了在兴许的代码中有可能会重复用到它。非常显然,JDK在编译Other类的时候,会解析到Date类有没实用到,发现该类在代码中就没实用到过,所以就觉得没有必要将它的信息放置到常量池中了。

将上述的Other类改写一下,仅使用new Date(),例如以下图所看到的:

package com.louis.jvm;

import java.util.Date;

public class Other{

public Other()

{

new Date();

}

}

这时候使用javap -v Other ,能够查看到常量池中有表示java/util/Date的常量池项:

5ea3964d1de56a5dec209e728a147ca4.png

总结:

1.对于某个类或接口而言,其自身、父类和继承或实现的接口的信息会被直接组装成CONSTANT_Class_info常量池项放置到常量池中;

2. 类中或接口中使用到了其它的类,仅仅有在类中实际使用到了该类时,该类的信息才会在常量池中有相应的CONSTANT_Class_info常量池项;

3. 类中或接口中仅仅定义某种类型的变量,JDK仅仅会将变量的类型描写叙述信息以UTF-8字符串组成CONSTANT_Utf8_info常量池项放置到常量池中,上面在类中的private Date date;JDK编译器仅仅会将表示date的数据类型的“Ljava/util/Date”字符串放置到常量池中。

作者的话

本文是《Java虚拟机原理图解》系列的当中一篇,假设您有兴趣,请关注该系列的其它文章~

认为本文不错,顺手点个赞哦~~您的鼓舞,是我继续分享知识的强大动力!

-----------------------------------------------------------------------------------------------------------------------------------------

本文源自  http://blog.csdn.net/luanlouis/,如需转载,请注明出处,谢谢!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值