String常量池
String类型是对象类型,但它是一种非常特殊的类型。因为String类型使用的非常多,因此Java标准中引入了String常量池,我估计引入常量池的一个目的是节省节省字符串占用的内存。
常量池对String变量的影响
首先来看一段代码
public static void main(String[] args) {
String s1 = "Hello";
String s2 = "Hello";
String s3 = "Hel" + "lo";
String s4 = "Hel" + new String("lo");
String s5 = new String("Hello");
String s6 = s5.intern();
String s7 = "H";
String s8 = "ello";
String s9 = s7 + s8;
String s10 = String.valueOf("Hello");
System.out.println(s1 == s2); // true
System.out.println(s1 == s3); // true
System.out.println(s1 == s4); // false
System.out.println(s1 == s9); // false
System.out.println(s4 == s5); // false
System.out.println(s1 == s6); // true
System.out.println(s1 == s10); // true
}
首先说明一点,在java 中,直接使用==操作符,比较的是两个字符串的引用地址,并不是比较内容,比较内容请用String.equals()。
s1 == s2这个非常好理解,s1、s2在赋值时,均使用的字符串字面量,说白话点,就是直接把字符串写死,在编译期间,这种字面量会直接放入class文件的常量池中,从而实现复用,载入运行时常量池后,s1、s2指向的是同一个内存地址,所以相等。
s1 == s3这个地方有个坑,s3虽然是动态拼接出来的字符串,但是所有参与拼接的部分都是已知的字面量,在编译期间,这种拼接会被优化,编译器直接帮你拼好,因此String s3 = “Hel” + “lo”;在class文件中被优化成String s3 = “Hello”;,所以s1 == s3成立。
s1 == s4当然不相等,s4虽然也是拼接出来的,但new String(“lo”)这部分不是已知字面量,是一个不可预料的部分,编译器不会优化,必须等到运行时才可以确定结果,结合字符串不变定理,鬼知道s4被分配到哪去了,所以地址肯定不同。配上一张简图理清思路:
注意方法区实际是堆的一部分,上图只是为了区分堆中的方法区,所以将其单独拿了出来。
s1 == s9也不相等,道理差不多,虽然s7、s8在赋值的时候使用的字符串字面量,但是拼接成s9的时候,s7、s8作为两个变量,都是不可预料的,编译器毕竟是编译器,不可能当解释器用,所以不做优化,等到运行时,s7、s8拼接成的新字符串,在堆中地址不确定,不可能与方法区常量池中的s1地址相同。
s4 == s5已经不用解释了,绝对不相等,二者都在堆中,但地址不同。
s1 == s6这两个相等完全归功于intern方法,s5在堆中,内容为Hello ,intern方法会尝试将Hello字符串添加到常量池中,并返回其在常量池中的地址,因为常量池中已经有了Hello字符串,所以intern方法直接返回地址;而s1在编译期就已经指向常量池了,因此s1和s6指向同一地址,相等。
s1 == s10,返回true。这是因为String.valueOf()方法返回的是String常量池中"Hello"的地址,而 s1 也指向这个地址。
注意事项
- 必须要关注编译期的行为,才能更好的理解常量池。
- 运行时常量池中的常量,基本来源于各个class文件中的常量池。
- 程序运行时,除非手动向常量池中添加常量(比如调用intern方法),否则jvm不会自动添加常量到常量池。
常量池在Java内存中的位置
- 在JDK7.及之前版本,字符串常量池是放在Perm Gen区(也就是方法区)中;
- 在JDK8版本,字符串常量池被移出了方法区,大概是因为方法区空间太小了吧。
Integer常量池
Integer常量池在哪很少有人提到,暂时认为也在堆内存吧。
Integer.valueOf()
public static Integer valueOf(int i)
返回一个表示指定的 int 值的 Integer 实例。如果不需要新的 Integer 实例,则通常应优先使用该方法,而不是构造方法 new Integer(int)。valueOf() 方法有可能通过缓存经常请求的值而显著提高空间和时间性能。
这个方法总默认缓存了 - 128 到 127 之间的值,不过它是可以更改的。
也就是说,Integer常量池一定缓存了-128到127之间的对象,因为这是一个字节表示的范围内的数,也是最常用的数,缓存这些就够了,过多的话会导致内存占用过大且没什么用。而要使用缓存,就不能使用new Integer()的方式,它是不走常量池的。
代码范例
public static void main(String[] args) {
int int1 = 20;
int int2 = 20;
Integer integer1 = new Integer(20);
Integer integer2 = new Integer(20);
Integer a1 = 127;
Integer a2 = 127;
Integer a3 = Integer.valueOf(127);
Integer a4 = new Integer(127);
Integer a = 128;
Integer b = 128;
System.out.println("int1 == int2 -> " + (int1 == int2));//true
System.out.println("int1 == integer1 -> " + (int1 == integer1));//true
System.out.println("integer1==integer2 ->" + (integer1 == integer2));//false
System.out.println("a1 == a2 -> " + (a1 == a2));//true
System.out.println("a1 == a3 -> " + (a1 == a3));//true
System.out.println("a1 == a4 -> " + (a1 == a4));//false
System.out.println("a == b -> " + (a == b));//false
}
解释
- int和int用==是比值
- Integer和int用==是比值
- Integer和Integer用 == 是比引用
上述 int 和 int 比较,或者 int 和Integer比较,比较的都是数字得值,所以结果为true。
Integer与Integer比较的是地址,如果Integer指向的是常量池中的数字地址,则相同的数字用 == 返回为true。故 a1==a3 返回true。