简介
String.intern()方法是一种手动将字符串加入常量池中的native方法,原理如下:如果在当前类的常量池中存在与调用intern()方法的字符串等值的字符串,就直接返回常量池中相应字符串的引用,否则在常量池中复制一份该字符串(Jdk7中会直接在常量池中保存当前字符串的引用),并将其引用返回;因此,只要是堆中等值的String对象,使用intern()方法返回的都是常量池中同一个String引用,所以,这些等值的String对象通过intern()后使用==是可以匹配的。
预备知识
一、创建String对象的两种方式
创建String对象分为在堆中创建和在字符串常量池中创建。
1、在字符串常量池中创建String对象
String str1 = "计算机";
String str2 = "计算机";
System.out.println(str1 == str2);
第一行代码
- 执行到括号中“计算机”的时候,会在字符串常量池中添加“计算机”对象。
- 然后将栈中的str1变量指向该对象。
第二行代码
- 执行到括号中“计算机”的时候,发现字符串常量池已存在“计算机”对象。
- 为避免重复创建对象,将栈中的str2变量指向字符串常量池已存在的对象,字符串常量池存在的原因正是如此。
补充:
//常量字符串的"+"操作,编译阶段直接会合成为一个字符串。
String str = "计算" + "机"; //编译时合并成String str = "计算机";
//对于final字段,编译期直接进行了常量替换。
final String str1 = "计算";
final String str2 = "机";
String str3 = str1 + str2; //编译时直接替换成了String str3 = "计算" + "机";
2、在堆中创建String对象
String str1 = new String("计算机");
String str2 = new String("计算机");
System.out.println(str1 == str2);
第一行代码
- 执行到括号中“计算机”的时候,会在字符串常量池中添加“计算机”对象。
- 执行完毕后会在堆中创建“计算机”对象,并将栈中的str1变量指向该对象。
第二行代码
- 执行到括号中“计算机”的时候,发现字符串常量池已存在“计算机”对象。
- 执行完毕后会因为new关键字在堆中创建出一个新的对象,并将栈中的变量str2指向该对象。
二、不同jdk版本中的intern()实现
jvm对字符串常量池在不同的jdk版本有不同的划分,内存的变化也会影响intern方法的执行。
JDK6 | JDK7及之后 | |
intern()方法 | 会把首次遇到的字符串实例复制到常量池中,并返回此引用 | 会把首次遇到的字符串实例的引用添加到常量池中,并返回此引用 |
- Jdk6中常量池位于PermGen(永久代)中,PermGen是一块主要用于存放已加载的类信息和字符串池的大小固定的区域。Jdk6中使用intern()方法的主要问题就在于常量池被保存在PermGen中:首先,PermGen是一块大小固定的区域,一般不同的平台PermGen的默认大小也不相同,大致在32M到96M之间。所以不能对不受控制的运行时字符串(如用户输入信息等)使用intern()方法,否则很有可能会引发PermGen内存溢出;其次String对象保存在Java堆区,Java堆区与PermGen是物理隔离的,因此如果对多个不等值的字符串对象执行intern操作,则会导致内存中存在许多重复的字符串,会造成性能损失。
- Jdk7将常量池从PermGen区移到了Java堆区,执行intern操作时,如果常量池已经存在该字符串,则直接返回字符串引用,否则复制该字符串对象的引用到常量池中并返回。堆区的大小一般不受限,所以将常量池从PremGen区移到堆区使得常量池的使用不再受限于固定大小。除此之外,位于堆区的常量池中的对象可以被垃圾回收。当常量池中的字符串不再存在指向它的引用时,JVM就会回收该字符串。
实例解析
代码一
String s1 = new String("1"); //常量池中创建"1",堆中创建"1"
s1.intern(); //常量池中已有"1",所以jdk6和jkd7都是返回指向常量池"1"的引用,
//但因为该语句没有赋值操作,所以s1仍指向堆中"1"
String s2 = "1"; //s2指向常量池中已存在的"1"
System.out.println(s1==s2); //s1指向堆中"1",s2指向常量池中"1",false
jdk6、7、8都返回false
代码二
String s3 = new String("1") + new String("1"); //常量池生成一个"1",堆生成一个"11"
//s3指向堆中"11"
//中间还有2个匿名的new String("1")暂不讨论
s3.intern(); //因为常量池中不存在"11",
//jdk6会将堆中"11"复制到常量池中,
//jdk7则将堆中"11"的引用添加到常量池中,
//此时s3仍指向堆中"11"
String s4 = "11"; //因为常量池中已存在"11"或其引用,s4指向常量池中"11"
System.out.println(s3==s4); //jdk6中,s4指向常量池中"11",s3指向堆中"11",false
//jdk7中,s4指向常量池中指向堆中"11"的引用,true
在jdk6中返回false,jdk7及以上返回true
适用场景
Jdk6 中常量池位于PremGen区,大小受限,不建议使用String.intern()方法,不过Jdk7 将常量池移到了Java堆区,大小可控,可以重新考虑使用String.intern()方法。
intern()方法优点:执行速度非常快,直接使用==进行比较要比使用equals()方法快很多;内存占用少。虽然intern()方法的优点看上去很诱人,但由于intern()操作每次都需要与常量池中的数据进行比较以查看常量池中是否存在等值数据,同时JVM需要确保常量池中的数据的唯一性,这就涉及到加锁机制,这些操作都是有需要占用CPU时间的,所以如果进行intern操作的是大量不会被重复利用的String的话,则有点得不偿失。由此可见,String.intern()主要 适用于只有有限值,并且这些有限值会被重复利用的场景,如数据库表中的列名、人的姓氏、编码类型等。