java 之 string
首先先来了解一下String的底层结构,在后端君所用的JDK版本1.8中,String类是通过一个char数组来存储字符串的。
public final class String implements java.io.Serializable, Comparable<String>, CharSequence {
// 用于存储字符串
private final char value[];
// 缓存字符串哈希值,默认为0
private int hash;
// 省略
}
可能很多同学也都注意到了String类是被final关键字修饰的,用于存储字符串的char数组也是被final关键字修饰的。这样设计的原因其实是保证了String的不可变性,包括String对象不可被继承,字符数组value属性的引用地址不可修改。
至于为什么要保证它不可变?别问,问就是设计,JDK工程师们精心的设计!
2. String被final修饰的原因
事实上,String类被设计成被final修饰确实是有它一定的道理的。
首先第一原因是高效,就拿常量池来说,只有变量是不可修改的,才能够被缓存起来,从而实现常量池的功能。同时,被final修饰意味着不可被修改,所以不需要考虑它的值被修改。
第二个原因是安全,Java之父James Gosling解释过,迫使String类设计成不可变的另一个原因是安全,当你在调用其他方法时,比如调用一些系统级操作指令之前,可能会有一系列校验,如果是可变类的话,可能在你校验过后,它的内部的值又被改变了,这样有可能会引起严重的系统崩溃问题。
在这里需要着重提到的是,虽然String对象的字符数组value属性是不可变的,但只是引用地址不可变,如果直接修改value属性的内容,还是可以成功的。
final char[] str = {'1','2','3'};
// 直接赋值将 str 数组的内容修改为{'1','2','4'}
str[2] = '4';
// 通过反射将 str 数组的内容修改为{'1','2','5'}
java.lang.reflect.Array.set(str, 2, '5');
以上两种方法都是没有改变一个被final修饰的变量的引用地址,而是直接修改引用所代表的数组元素,成功修改了一个被final修饰的变量的内容。
3. String 的创建流程
明白了String类的底层存储结构之后,我们再来看它的创建流程,回想一下文本刚开始提到的那个问题,String str = new String(“abc”)这个语句创建了几个对象?
再提出一个问题进行对比:String str = "abc"与String str = new String(“abc”)有什么区别吗?
在回答这两个问题之前,我们必须知道一些概念。如果有了解过JVM的同学会知道,虚拟机中有一个地方叫常量池,它会存储字符串常量,在JDK1.7之后常量池位于Java堆中。在程序中创建的对象实例,也会被存放在Java堆中,但与常量池存放的位置是不一样的。还有就是,对象的引用变量如上述代码中的str,会被存放在虚拟机栈中。
上面提出的第二个问题说到了String对象的两种创建方式:直接赋值和new。
3.1 直接赋值
首先来说直接赋值,首先会去常量池中寻找abc字符串是否存在,若已存在会将str引用变量直接指向常量池中的值。如果不存在,会在常量池中先创建一个abc字符串,然后把str指向刚刚创建出来的abc字符串。
3.2 new String()
而对于使用new关键词来创建一个String对象,首先虚拟机会在Java堆中创建一个String对象,然后再去常量池中寻找abc字符串是否存在,如果不存在会在常量池中创建一个abc字符串,然后把Java堆中的对象引用的值指向在常量池中创建的abc字符串;若常量池中已存在abc字符串,不会创建该字符串,也不会改变Java堆中对象的引用值。
综上所述,String str = new String(“abc”)这个语句,会创建1个或2个对象,若常量池中没有abc字符串,那么会创建2个对象,否则只会在Java堆中创建一个对象。
而直接赋值语句会创建0个或1个对象,若常量池中没有abc字符串,会创建1个对象,否则不会创建对象,只需要将引用指向常量池中的abc字符串。
3.3 代码示例
我们写两个例子验证一下上面的结论。
public static void main(String[] args) {
String a = new String("abc");
String b = "abc";
System.out.println(a==b);
}
我们画一张图来描述一下示例代码中对象之间的关系
第一行代码中使用new String(“abc”)创建了一个对象,所以会在堆中创建一个value[]对象,而此时常量池不存在abc字符串,所以会在常量池中创建此字符串,并将value[]对象的引用值指向常量池中的abc字符串,但是这两个值的地址是不一样的。
第二行代码中使用直接赋值的方式,由于常量池中abc字符串已经存在,所以b这个引用变量会直接指向常量池中的abc字符串。
最后,由于value[]对象的地址与常量池中abc字符串的地址是不一样的,所以a与b是不相等的。
4. 面试题
下面再罗列几道常见的面试题。
==和equals的区别
编译器对于String类拼接如何进行优化
String#intern方法的含义
compareTo和equals都是用于比较,有什么区别
String、StringBuilder和StringBuffer的区别
原創链接:原文