关于java的String一些问题(创建过程、intern()方法、字符串常量池),jdk6/jdk7/jdk8,详细到底层源码和jvm

前置知识和前提说明:

①要先对java虚拟机、String和StringBuilder源码有一定了解
②String的intern方法:这是一个native方法,调用的是本地底层c++的方法,作用为:

jdk<7:在常量池中查找,如果有,则返回常量池中该字符串字面量的引用地址,没有则在池中新建字符串字面量,然后返回该字面量的引用地址。
jdk>=7:则是将字符串字面量本身在池中查找,如果有,则返回池中的引用地址,这里没有变化,如果没有则会将堆中的引用传递给常量池,然后返回这个指向堆的引用。也就是说,jdk>=7堆中不会创建两个相同的字面量字符串,最多只会在常量池中增加一个引用地址的值,实质上没有产生新东西,这样可以减少字符串的创建。
③“引用”、“地址”、“引用地址”这三个词都是同一个意思。
④本文中“常量池”默认为字符串常量池。

先看图:jdk6,7,8的jvm结构图

jdk6永久代使用的是虚拟机内存,字符串常量池(String Table)在方法区中:
jdk6永久代使用的是虚拟机内存,字符串常量池(String Table)在方法区中
jdk7永久代使用的是虚拟机内存,不过字符串常量池(String Table)移到了堆中:
jdk7永久代使用的是虚拟机内存,不过字符串常量池(String Table)移到了堆中
jdk8方法区用元空间来实现,不使用虚拟机内存,使用的是本地内存,字符串常量池(String Table)仍然保留在堆中:
jdk8方法区用元空间来实现,不适用虚拟机内存,使用的是本地内存,字符串常量池(String Table)仍然保留在堆中

创建String对象的几种方式以及其底层过程

(由于jdk7和jdk8的字符串常量池都是在堆中,所以以下几种方式中jdk7等同jdk8)
耐心去理解领悟下面7个例子,就能明白所有关于String的底层问题!

①:

String s1 = "abc";
String s2 = "abc";
System.out.println(s1 == s2); //true

内存分析:

对于s1这行代码,jvm执行引擎会以字面量的方式创建的字符串"abc"直接放到常量池中(jdk6/7都是),s1作为变量存在中,然后把池中"abc"的引用地址赋值给变量s1。
对于s2这行代码,本该创建的字符串"abc"直接放到常量池中,发现池中已经有"abc",于是直接把"abc"的引用地址赋值给变量s2。
也就是,s1和s2保存的都是池中"abc"的地址,所以s1 == s2为true
在这里插入图片描述

②:

String s1 = "abc"+"def";
String s2 = "abcdef";
System.out.println(s1 == s2); //true(jdk7)

内存分析(jdk7中,在jdk6中也差不多,只是常量池在jvm中的位置不一样):

对于s1这行代码,“abc"和"def"不会放入常量池,编译器在编译时产生的字节码已经将 “abc” + “def” 优化成了 “abcdef”
放入常量池,然后返回池中"abcdef"的引用地址赋值给变量s1。具体可以看反编译字节码指令,不会出现"abc"和"def”:
字节码指令详情
对于s2这行代码,"abcdef"本应该放入常量池,可是由于已存在相同的字符串,于是返回原本存在的"abcdef"的引用赋值给变量s2

内存结构

③:

String s1 = new String("abc");
String s2 = s1.intern();
System.out.println(s1 == s2); //false

内存分析:

jdk6中:
先在常量池中创建了"abc"这个字面量,然后在堆中创建了一个String对象,s1的属性value指向的是字符串常量池中的"abc",所以变量s1指向的是堆中的这个String对象。
为什么会先在常量池中创建了"abc"这个字面量?
看new String(“abc”)这个构造器方法的源码:
"abc"字面量作为实参传给构造器的形参,这个形参可以看作为方法的变量,给形参赋值的过程相当于:String original = “abc”,于是就把"abc"当做字面量放进了常量池

	public String(String original) { //构造器源码
        this.value = original.value;
        this.hash = original.hash; 
    }

在这里插入图片描述

jdk7:同jdk6,只是jdk7的常量池在堆中。
s1.intern()返回的是常量池的"abc"的引用地址,所以s2的值为池中"abc"的引用地址,s1的值为堆中(非池中)对象的地址,所以s1 == s2 返回false
所以jdk6和7中过程一样,只是常量池位置不一样
在这里插入图片描述

以下就不分析jdk6了,自行分析,都分析太多了,jdk6也过时了,主要是要能了解jdk7及以后

④:

String s1 = "abc" + new String("def");
s1.intern();
String s2 = "abcdef";
System.out.println(s1 == s2); //true

先说说第一行String s1 = “abc” + new String(“def”)的过程:
常量池创建"abc"字面量 —>底层创建一个StringBuilder对象,append方法拼接"abc" —> 常量池创建"def"字面量
—> 堆中new String对象,对象的value保存常量池中"def"的引用(此对象没有被引用,发生full gc时会被回收)
—> 调用append方法拼接"def" —> 拼接完成,调用StringBuilder对象的toString()生成一个String对象在堆中,
字面量为"abcdef",并把对象的引用返回给s1,这个toString方法不会在常量池中生成字面量"abcdef"字符串
(至于为什么,自己看源码或者查资料,下面也有讲)
—> 执行第二行s1.intern()方法:由于在堆中发现有一个字面量为"abcdef"的String对象,于是把对象的引用添加到常量池中 —>
由于常量池中已经含有字面量为"abcdef"的引用(“不是字面量!是堆对象的引用”),所以s2变量的值也是堆对象的引用
—> s1和s2同为堆对象的引用,所以s1 == s2为true

内存图:
在这里插入图片描述

交换一下位置
仅仅交换了第二行和第三行的位置,s1 == s2 就变成false了,突然人傻了,不过看看底层是怎么操作就知道原因了

String s1 = "abc" + new String("def");
String s2 = "abcdef";
s1.intern();
System.out.println(s1 == s2); //false

第一行String s1 = “abc” + new String(“def”):和上面一样,s1保存的是堆中对象的引用地址,不重复说了 —>
第二行:常量池中没有字面量"abcdef",于是创建字面量"abcdef"放入常量池,把字面量引用地址赋值给s2。—>
第三行:发现常量池中含有字面量"abcdef",返回值为该字面量的引用
因此,此时s1为堆中对象的引用,s2为常量池中字面量"abcdef"的引用,所以s1 == s2返回false。

内存图:
在这里插入图片描述

⑤:

自行分析,和④几乎一样

		String s1 = new String("abc") + new String("def");
        s1.intern();
        String s2 = "abcdef";
        System.out.println(s1 == s2); //true

交换第二行和第三行:

		String s1 = new String("abc") + new String("def");
        String s2 = "abcdef";
        s1.intern();
        System.out.println(s1 == s2); //false

以上总结

从例子② ④ ⑤ 可知:
只要字符串拼接,含有一个是变量,则编译期都是调用StringBuilder的append拼接

String s1 = "a"+"b"//编译期就被优化成"a+b",未用到StringBuilder拼接String s1 = "a";
  String s2 = s1 + "b"; //s1是变量,使用到StringBuilder拼接String s1 = "a";
  String s2 = "a" + new String("b");// new String("b")也算变量,使用到StringBuilder拼接final String s1 = "a";
  final String s2 = "b";
  String s3 = "ab";
  String s4 = s1 + s2; //s1和s2都是常量,s1+s2编译期被优化成字面量"ab";
  System.out.println(s3 == s4); //true,

⑥:

在这里插入图片描述

		String s1 = new String(new char[]{'a', 'b', 'c'});
        s1.intern();
        System.out.println(s1 == s1.intern());//true

        String s2 = new String("def");
        s2.intern();
        System.out.println(s2 == s2.intern());//false

为什么是结果是true,false呢?这里我只分析s1,s2在上面有讲,就不重复了,这里也写出来是为了对比
我画图展示其中的过程大家就懂了:

第一行String s1 = new String(new char[]{‘a’, ‘b’, ‘c’}):
s1这样构造String对象调用的是new String(char value[])这个构造器,这个构造器只会把参数value[]数组复制到一个new char[newLength]中(源码可以看到),然后返回这个new char[newLength]数组的地址给String对象的value
第二行s1.intern():
先在常量池中查找,没有找到s1的字面量"abc",然后去堆中发现s1指向的String对象的字面量为"abc",然后把这个对象的引用值放入到常量池,并把常量池中的这个引用值返回。所以s1==s1.intern返回true。
假设再创建一个String s3 = “abc”,由于常量池中有字面量"abc"的对象引用,所以s3保存的也是s1指向的堆中String对象引用,所以s1 == s3 也会返回true。
因此,s1、s1.intern()、s3的值都相等。
在这里插入图片描述

⑦:

看这三段代码,结果是false、false、true

		String s1 = new StringBuilder("ja").append("va").toString();
        s1.intern();
        System.out.println(s1 == s1.intern()); //false
        
        String s2 = new StringBuilder("s2").toString();
        s2.intern();
        System.out.println(s2 == s2.intern()); //false

        String s3 = new StringBuilder("hello").append("world").toString();
        s3.intern();
        System.out.println(s3 == s3.intern()); //true

先是对StringBuilder源码进行分析:
new StringBuilder(“xxx”)构造器:
在这里插入图片描述
StringBuilder的append方法:

这个append方法调用的是父类AbstractStringBuilder的append方法,把方法传入的参数String str看出方法内变量,
可看出完整语句为:String str = “xxx”,"xxx"为传进来的实参,如果实参是对象而不是字面量,可以看出:String str = new String(“xxx”)。
阅读方法内代码可以发现,是把str拆解成char数组,然后复制个StringBuilder的属性value

有了上面的基础,于是对这三段代码进行分析:
第一段:

第一行代码:
StringBuilder构造器把"ja"作为字面量放入常量池,append把"va"作为字面量放入常量池,toString创建了一个String对象放在堆中,String对象的value属性指向的是堆中new的一个char[],字面量为"java",而不会在常量池中生成这个"java"(看源码,toString返回的是return new String(value, 0, count),这样创建String的对象不会在常量池中创建字面量),然后把这个堆对象的引用赋值给s1,因此,s1指向的是堆中String对象。
第二行代码:
jvm在常量池中找字面量为"java"的字符串,注意!jvm编译时会预先自动加载字面量"java"放入常量池,所以s1.intern会在常量池中找字面量为"java"的返回,跟s1指向的不是同一个东西,s1指向的是堆中的字符串对象s1.intern返回的是常量池中本身存在的"java"字面量引用,所以s1 == s1.intern()返回false。

		String s1 = new StringBuilder("ja").append("va").toString();
        s1.intern();
        System.out.println(s1 == s1.intern()); //false

第二段:

第一行代码:
StringBuilder构造器把"s2"作为字面量放入常量池,toString创建了一个String对象放在堆中,String对象的value属性指向的是堆中new的一个char[](第一段有解释),字面量为"s2",注意此时,堆中有两个"s2",一个以字面量存放在常量池中,一个以String对象存放在堆的非常量池中。
所以,对于第二行代码s2.intern(),先在常量池中找字面量为"s2"的字符串,发现已经有了,就返回这个字面量引用
所以,变量s2指向的是堆中字符串对象,s1.intern返回的是常量池中的"s2"字符串,所以s1 == s1.intern()返回false。

		String s2 = new StringBuilder("s2").toString();
        s2.intern();
        System.out.println(s2 == s2.intern()); //false

第三段:

第一行代码:
StringBuilder构造器把"hello"作为字面量放入常量池,append把"world"作为字面量放入常量池,toString创建了一个String对象放在堆中,String对象的value属性指向的是堆中new的一个char[](第一段有解释),字面量为"helloworld",此时,堆中有一个String对象(“helloworld”),常量池中有两个字面量"hello"和"world",并没有"helloworld"。
第二行代码 s3.intern():
先以s3对象字面量"helloworld"在常量池中查找是否存在,发现不存在,然后堆中非常量池区域找是否有字面量为"helloworld"的对象,发现存在,于是把这个对象的引用放入到常量池中,intern返回常量池中保存的这个引用值,也就是堆中对象的引用。
所以:s3的值是堆中String对象的引用,s3.intern()返回的也是堆中String对象的引用,所以
s3 == s3.intern()返回true。

        String s3 = new StringBuilder("hello").append("world").toString();
        s3.intern();
        System.out.println(s3 == s3.intern()); //true

		final String s1 = "a";
        final String s2 = "b";
        String s3 = "ab";
        String s4 = s1 + s2;
        System.out.println(s3 == s4);//true
 		String s1 = "javaEEhadoop";
        String s2 = "javaEE";
        String s3 = s2 + "hadoop";
        System.out.println(s1 == s3);//false

        final String s4 = "javaEE";//s4:常量
        String s5 = s4 + "hadoop";
        System.out.println(s1 == s5);//true

字符串拼接操作不一定使用的是StringBuilder!
如果拼接符号左右两边都是字符串常量或常量引用,则仍然使用编译期优化,即非StringBuilder的方式。
针对于final修饰类、方法、基本数据类型、引用数据类型的量的结构时,能使用上final的时候建议使用上。

如果有疑惑或者发现文中错误请评论提出!

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值