关于字符串的陷阱
JVM对字符串的处理
首先看如下代码:
String java=new String("HelloJack");
上面创建了两个字符串对象,其中一个是“HelloJack”这个直接量对应的字符串对象,另一个是由new String()构造器返回的字符串对象。
对于Java程序中的字符串直接量,JVM会使用一个字符串池来保存它们:当第一次使用某个字符串直接量是,JVM会将它放入字符串池进行缓存。在一般情况下,字符串池的字符串对象不会被垃圾回收,当程序再次需要使用该字符串时,无需重新创建一个新的字符串,而是直接让引用变量指向字符串池中已有的字符串。如下代码:
String str1="Hello Java";
String str2="Hello Java";
System.out.println(str1==str2);
因为str1和str2都是直接量,都指向JVM字符串池里的“Hello Java”字符串,所以为true;
除了直接创建之外,也可以通过字符串连接表达式创建字符串对象,因此可以将一个字符串连接表达式赋给字符串变量。如果这这个字符串连接表达式的值可以在编译时确定下来,那么JVM会在编译时计算该字符串变量的值,并让它指向字符串池中对应的字符串。如下代码:
String str1="HelloJava";
String str2="Hello"+"Java";
System.out.println(str1==str2);
最终结果返回就是true.需要注意的是上面都是直接量,而没有变量,没有方法的调用。因此,JVM可以在比编译时就确定该字符串连接表达式的值,可以让该字符串变量指向字符串池中对应的字符串。但如果程序使用了变量,或者调用的方法,那么只能等到运行时才能确定该字符串连接表达式的值,也就无法再编译时确定该字符串变量的值,因此无法利用JVM的字符串池。如下代码:
String str1="HelloJava9";
String str2="Hello"+"Java9";
System.out.println(str1==str2);
String str3="HelloJava"+"HelloJava".length();
System.out.println(str1==str3);
第一个返回了true,第二个输出返回了false;
当然还有一个情况例外的,就是当变量执行“宏替换”时也是可以让字符串变量指向JVM字符串池中对应字符串。如下代码:
String str1="HelloJava9";
String str2="Hello"+"Java9";
System.out.println(str1==str2);
final int len=9;
String str3="HelloJava"+len;
System.out.println(str1==str3);
不可变的字符串
String类是一个典型的不可变类。当一个String对象创建完成后,该String类里包含的字符序列就被固定下来,以后永远都不会改变。如下代码:
String str="Hello";
System.out.println(System.identityHashCode(str));
str=str+"Java";
System.out.println(System.identityHashCode(str));
当一个String对象创建完成后