《深入理解java虚拟机》String.intern()探究

一、背景

《深入理解java虚拟机》第二版 57页对String.intern()返回引用的测试代码如下:

/** String的intern例子
 * Created by 明明如月 on 2017-05-24.
 */
public class RuntimeConstantPoolOOM {
    public static void main(String[] args) {
        String str1 = new StringBuilder("计算机").append("软件").toString();
       // String str3= new StringBuilder("计算机软件").toString();
        System.out.println(str1.intern() == str1);
        String str2 = new StringBuilder("Java(TM) SE ").append("Runtime Environment").toString();
        System.out.println(str2.intern() == str2);
    }
}

 

结果是 :

true

false

可能很多人觉得这个结果很奇怪,在这里我们进行深入地探究。


二、解释

 

书中写道,如果JDK1.6会返回两个false,JDK1.7运行则会返回一个true一个false。

 

因为JDK1.6中,intern()方法会把首次遇到的字符串实例复制到永久代中,返回的也是永久代中这个字符串的实例的引用,而StringBulder创建的字符串实例在Java堆上,所以必然不是同一个引用,将返回false。

 

在JDK1.7中,intern()的实现不会在复制实例,只是在常量池中记录首次出现的实例引用,因此返回的是引用和由StringBuilder.toString()创建的那个字符串实例是同一个。

 

str2的比较返回false因为"java"这个字符串在执行StringBuilder.toString()之前已经出现过,字符串常量池中已经有它的引用了,不符合“首次出现”的原则,而“计算机软件”这个字符串是首次出现,因此返回true。


三、追溯

那么就有疑问了,这个“java”字符串在哪里出现过呢?显然并不是直接出现在这个类里面。

我们分别打开String 、StringBuilder和System类的源码看看有啥发现,

其中在System类里发现

《深入理解java虚拟机》String.intern()探究

根据注释可以看出来,System是由虚拟机自动调用的。

《深入理解java虚拟机》String.intern()探究

在initializeSystemClass 方法中发现调用了Version对象的init静态方法

《深入理解java虚拟机》String.intern()探究

而Version类里 laucher_name是私有静态字符串常量

《深入理解java虚拟机》String.intern()探究

因此sun.misc.Version 类会在JDK类库的初始化过程中被加载并初始化,而在初始化时它需要对静态常量字段根据指定的常量值(ConstantValue)做默认初始化,此时被 sun.misc.Version.launcher 静态常量字段所引用的"java"字符串字面量就被intern到HotSpot VM的字符串常量池——StringTable里了。

因此我们修改一下代码:

String str2 = new StringBuilder("Java(TM) SE ").append("Runtime Environment").toString(); System.out.println(str2.intern() == str2)

 

发现结果还是false

从而更加证实了我们的猜测。


 

四、方法

可能有些人会说,我咋知道 System 静态代码块中会初始化这个字符串呢?

办法很多

4.1  打印加载的类

使用:-XX:+TraceClassLoading 虚拟机参数打印类的加载顺序

// 前后省略了很多

[Loaded java.lang.reflect.Type from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar]
[Loaded java.lang.Class from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar]
[Loaded java.lang.Cloneable from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar]
[Loaded java.lang.ClassLoader from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar]
[Loaded java.lang.System from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar]
[Loaded java.lang.Throwable from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar]
[Loaded java.lang.Error from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar]

我们看到加载到了System类,因此可以进去看看,发现可能是这里。

 

4.2 调试法

随便找一个简单的程序打个断点,然后右下角 memory选项卡找到String

双击字符串,输入 "java".equals(this),即可查看已经构造的字符串对象

 

或者直接在String的 value数组上加上如下条件断点:

最终发现是通过这个函数构造的:

 

五、总结

 

再遇到类似问题的时候,希望大家可以多从源码角度去追本溯源,能够多分享出来。

 

六、答疑


有朋友问为啥

String string1 = new StringBuilder("tests").toString(); 

System.out.println(string1.intern() == string1); 

的结果是false?

 

首先 "tests" 本身是字符串字面量默认是 intern 的,假设引用为 abc。

而字符串string1 为  StringBuilder#toString 大家可以看下源码,这里返回的是新的字符串对象,假设引用是 def。

 @Override
    public String toString() {
        // Create a copy, don't share the array
        return new String(value, 0, count);
    }

显然  string1.intern 引用为  abc, string1的引用为 def 显然不是同一个对象。

 

有些人会问,你咋知道  字符串字面量就 Intern的呢?

在这里特别强调大家一定一定要自己主动去看源码,而不是等着别人来教你。其次看源码一定一定要看注释。

 

   /**
     * Returns a canonical representation for the string object.
     * <p>
     * A pool of strings, initially empty, is maintained privately by the
     * class {@code String}.
     * <p>
     * When the intern method is invoked, if the pool already contains a
     * string equal to this {@code String} object as determined by
     * the {@link #equals(Object)} method, then the string from the pool is
     * returned. Otherwise, this {@code String} object is added to the
     * pool and a reference to this {@code String} object is returned.
     * <p>
     * It follows that for any two strings {@code s} and {@code t},
     * {@code s.intern() == t.intern()} is {@code true}
     * if and only if {@code s.equals(t)} is {@code true}.
     * <p>
     * All literal strings and string-valued constant expressions are
     * interned. String literals are defined in section 3.10.5 of the
     * <cite>The Java&trade; Language Specification</cite>.
     *
     * @return  a string that has the same contents as this string, but is
     *          guaranteed to be from a pool of unique strings.
     */
    public native String intern();

 

这里讲到

 All literal strings and string-valued constant expressions are interned.
所有的字符串字面量(如"abc")和字符串常量表达式(如 "a"+"bc")都是 interned 的。 

 

 

 

  • 12
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 14
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

明明如月学长

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值