《深入理解java虚拟机》String.intern()探究

一、背景

《深入理解java虚拟机》第二版 57页对String.intern()返回引用的测试代码如下:

/** String的intern例子
 * Created by 明明如月 on 2017-05-24.
 */
public class RuntimeConstantPoolOOM {
    public static void main(String[] args) {
        String str1 = new StringBuilder("计算机").append("软件").toString();
       // String str3= new StringBuilder("计算机软件").toString();
        System.out.println(str1.intern() == str1);
        String str2 = new StringBuilder("Java(TM) SE ").append("Runtime Environment").toString();
        System.out.println(str2.intern() == str2);
    }
}

 

结果是 :

true

false

可能很多人觉得这个结果很奇怪,在这里我们进行深入地探究。


二、解释

 

书中写道,如果JDK1.6会返回两个false,JDK1.7运行则会返回一个true一个false。

 

因为JDK1.6中,intern()方法会把首次遇到的字符串实例复制到永久代中,返回的也是永久代中这个字符串的实例的引用,而StringBulder创建的字符串实例在Java堆上,所以必然不是同一个引用,将返回false。

 

在JDK1.7中,intern()的实现不会在复制实例,只是在常量池中记录首次出现的实例引用,因此返回的是引用和由StringBuilder.toString()创建的那个字符串实例是同一个。

 

str2的比较返回false因为"java"这个字符串在执行StringBuilder.toString()之前已经出现过,字符串常量池中已经有它的引用了,不符合“首次出现”的原则,而“计算机软件”这个字符串是首次出现,因此返回true。


三、追溯

那么就有疑问了,这个“java”字符串在哪里出现过呢?显然并不是直接出现在这个类里面。

我们分别打开String 、StringBuilder和System类的源码看看有啥发现,

其中在System类里发现

《深入理解java虚拟机》String.intern()探究

根据注释可以看出来,System是由虚拟机自动调用的。

《深入理解java虚拟机》String.intern()探究

在initializeSystemClass 方法中发现调用了Version对象的init静态方法

《深入理解java虚拟机》String.intern()探究

而Version类里 laucher_name是私有静态字符串常量

《深入理解java虚拟机》String.intern()探究

因此sun.misc.Version 类会在JDK类库的初始化过程中被加载并初始化,而在初始化时它需要对静态常量字段根据指定的常量值(ConstantValue)做默认初始化,此时被 sun.misc.Version.launcher 静态常量字段所引用的"java"字符串字面量就被intern到HotSpot VM的字符串常量池——StringTable里了。

因此我们修改一下代码:

String str2 = new StringBuilder("Java(TM) SE ").append("Runtime Environment").toString(); System.out.println(str2.intern() == str2)

 

发现结果还是false

从而更加证实了我们的猜测。


 

四、方法

可能有些人会说,我咋知道 System 静态代码块中会初始化这个字符串呢?

办法很多

4.1  打印加载的类

使用:-XX:+TraceClassLoading 虚拟机参数打印类的加载顺序

// 前后省略了很多

[Loaded java.lang.reflect.Type from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar]
[Loaded java.lang.Class from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar]
[Loaded java.lang.Cloneable from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar]
[Loaded java.lang.ClassLoader from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar]
[Loaded java.lang.System from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar]
[Loaded java.lang.Throwable from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar]
[Loaded java.lang.Error from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar]

我们看到加载到了System类,因此可以进去看看,发现可能是这里。

 

4.2 调试法

随便找一个简单的程序打个断点,然后右下角 memory选项卡找到String

双击字符串,输入 "java".equals(this),即可查看已经构造的字符串对象

 

或者直接在String的 value数组上加上如下条件断点:

最终发现是通过这个函数构造的:

 

五、总结

 

再遇到类似问题的时候,希望大家可以多从源码角度去追本溯源,能够多分享出来。

 

六、答疑


有朋友问为啥

String string1 = new StringBuilder("tests").toString(); 

System.out.println(string1.intern() == string1); 

的结果是false?

 

首先 "tests" 本身是字符串字面量默认是 intern 的,假设引用为 abc。

而字符串string1 为  StringBuilder#toString 大家可以看下源码,这里返回的是新的字符串对象,假设引用是 def。

 @Override
    public String toString() {
        // Create a copy, don't share the array
        return new String(value, 0, count);
    }

显然  string1.intern 引用为  abc, string1的引用为 def 显然不是同一个对象。

 

有些人会问,你咋知道  字符串字面量就 Intern的呢?

在这里特别强调大家一定一定要自己主动去看源码,而不是等着别人来教你。其次看源码一定一定要看注释。

 

   /**
     * Returns a canonical representation for the string object.
     * <p>
     * A pool of strings, initially empty, is maintained privately by the
     * class {@code String}.
     * <p>
     * When the intern method is invoked, if the pool already contains a
     * string equal to this {@code String} object as determined by
     * the {@link #equals(Object)} method, then the string from the pool is
     * returned. Otherwise, this {@code String} object is added to the
     * pool and a reference to this {@code String} object is returned.
     * <p>
     * It follows that for any two strings {@code s} and {@code t},
     * {@code s.intern() == t.intern()} is {@code true}
     * if and only if {@code s.equals(t)} is {@code true}.
     * <p>
     * All literal strings and string-valued constant expressions are
     * interned. String literals are defined in section 3.10.5 of the
     * <cite>The Java&trade; Language Specification</cite>.
     *
     * @return  a string that has the same contents as this string, but is
     *          guaranteed to be from a pool of unique strings.
     */
    public native String intern();

 

这里讲到

 All literal strings and string-valued constant expressions are interned.
所有的字符串字面量(如"abc")和字符串常量表达式(如 "a"+"bc")都是 interned 的。 

 

 

 

Java 中,`String.intern()` 是一个用于字符串对象的方法。它的作用是将字符串对象添加到字符串常量池中,并返回常量池中该字符串的引用。 具体含义如下: 1. 字符串常量池:Java 中的字符串常量池是一个特殊的内存区域,用于存储字符串字面值。当创建字符串时,如果字符串常量池中已经存在相同的字符串字面值,则会直接返回常量池中的引用,而不会创建新的对象。 2. `String.intern()` 方法:`intern()` 方法是 `String` 类提供的一个实例方法。调用它会检查当前字符串对象在常量池中是否存在。如果存在,则返回常量池中的引用;如果不存在,则将当前字符串对象添加到常量池中,并返回该引用。 使用 `String.intern()` 方法的主要目的是节省内存和提高性能。通过将字符串对象放入常量池中,可以重复使用相同的字符串字面值,减少内存占用,并且可以更快地比较字符串的相等性。 例如: ```java String str1 = new String("Hello"); String str2 = str1.intern(); System.out.println(str1 == str2); // false System.out.println(str1.equals(str2)); // true ``` 在上面的例子中,`str1` 是通过 `new String("Hello")` 创建的新字符串对象,而 `str2` 是通过 `str1.intern()` 返回的常量池中的引用。虽然它们的值相等,但它们是不同的对象,所以 `str1 == str2` 返回 `false`,而 `str1.equals(str2)` 返回 `true`。 需要注意的是,`String.intern()` 方法可能会在某些情况下导致一些性能问题和潜在的内存泄漏。因此,在使用时要注意评估场景和潜在的影响。
评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

明明如月学长

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值