1、静态常量池和运行时常量池
在Java程序中,有很多的东西是永恒的,不会在运行过程中变化。比如一个类的名字,一个类字段的名字/所属类型,一个类方法的名字/返回类型/参数名与所属类型,一个常量,还有在程序中出现的大量的字面值。
静态常量池:编译器将源程序编译成class文件后,会用一部分字节分类存储这些不变的代码,而这些字节我们就称为静态常量池。
运行时常量池:jvm启动后,会把这些东西加在到内存,这时候会把符号引用转变为直接引用,保存在方法区(永久代),java8以后保存在元空间。注:字符串池有点特殊,后面介绍。
2、不是所有字面量都存在常量池中
如 int i = 1,在常量池中找不到这一项,因为对于整数字面量来说,如果值在 -32768~32767 都会直接嵌入指令中(我理解就是存在栈上),而不会保存在常量区。long、double也有类似情况。
但是对于final修饰的字面量,一定会存在常量池中,如final int i = 1。
3、包装类对象池
包装类的对象池(也有称常量池)和JVM的静态/运行时常量池没有任何关系。包装类的对象池是池化技术的应用,并非是虚拟机层面的东西,而是 Java 在类封装里实现的。
比如Integer对象池是通过IntegerCache实现,IntegerCache 是 Integer 在内部维护的一个静态内部类,用于对象缓存。通过源码我们知道,Integer 对象池在底层实际上就是一个变量名为 cache 的数组,里面包含了 -128 ~ 127 的 Integer 对象实例。
使用对象池的方法就是通过 Integer.valueOf() 返回 cache 中的对象,像 Integer i = 10 这种自动装箱实际上也是调用 Integer.valueOf() 完成的。
如果使用的是 new 构造器,则会跳过 valueOf(),所以不会使用对象池中的实例。
4、字符串池
在 JDK 1.6 以及以前的版本中,字符串池是放在 Perm 区(Permanent Generation,永久代)。在 JDK 1.7 的版本中,字符串池移到Java Heap。在 JDK 1.8 中永久代的说法被废弃,元空间成为方法区的替代品。
由于字符串池是虚拟机层面的技术,所以在 String 的类定义中并没有类似 IntegerCache 这样的对象池,String 类中提及缓存/池的概念只有intern()
这个方法。
字符串池(String pool)实际上是一个 HashTable。
看一道比较常见的面试题,下面的代码创建了多少个 String 对象?
String s1 = new String("he") + new String("llo");
String s2 = s1.intern();
System.out.println(s1 == s2);
// 在 JDK 1.6 下输出是 false,创建了 6 个对象
// 在 JDK 1.7 之后的版本输出是 true,创建了 5 个对象
// 当然我们这里没有考虑GC,但这些对象确实存在或存在过
为什么输出会有这些变化呢?主要还是字符串池从永久代中脱离、移入堆区的原因, intern() 方法也相应发生了变化:
在 JDK 1.6 中,调用 intern() 首先会在字符串池中寻找 equal() 相等的字符串,假如字符串存在就返回该字符串在字符串池中的引用;假如字符串不存在,虚拟机会重新在永久代上创建一个实例,将 StringTable 的一个表项指向这个新创建的实例。
在 JDK 1.7 中,由于字符串池不在永久代了,intern() 做了一些修改,更方便地利用堆中的对象。字符串存在时和 JDK 1.6一样,但是字符串不存在时不再需要重新创建实例,可以直接指向堆上的实例。
由上面两个图,也不难理解为什么 JDK 1.6 字符串池溢出会抛出 OutOfMemoryError: PermGen space ,而在 JDK 1.7 抛出 OutOfMemoryError: Java heap space 。
5、s="a"和s=new String("a")
采用字面值的方式创建一个字符串时,JVM首先会去字符串池中查找是否存在"a"这个对象,如果不存在,则在字符串池中创建"a"这个对象,然后将池中"a"这个对象的引用地址返回给字符串常量s,这样s会指向池中"a"这个字符串对象;如果存在,则不创建任何对象,直接将池中"a"这个对象的地址返回,赋给字符串常量。
采用new关键字新建一个字符串对象时,JVM首先在字符串池中查找有没有"a"这个字符串对象,如果有,则不在池中再去创建"a"这个对象了,直接在堆中创建一个"a"字符串对象,然后将堆中的这个"a"对象的地址返回赋给引用s,这样,s就指向了堆中创建的这个"a"字符串对象;如果没有,则首先在字符串池中创建一个"a"字符串对象,然后再在堆中创建一个"a"字符串对象,然后将堆中这个"a"字符串对象的地址返回赋给s引用,这样,s指向了堆中创建的这个"a"字符串对象。