本文翻译自programcreek原文地址
JDK6和JDK7中的subString()方法
JDK6和JDK7中的subString(int beginIndex, int endIndex)方法是不同的。了解其中的差异可以帮助你更好的使用它们。为了简单起见,以下用subString()代表subString(int beginIndex, int endIndex)。
1、subString()是干什么用的
subString(beginIndex,endIndex)返回一个字符串从beginIndex开始,endIndex-1结束的子串。
String x = "abcdef";
x = x.substring(1,3);
System.out.println(x);
Output:
bc
2、调用subString()时发生了什么?
你可能知道因为x是不可变的,当x被分配到x.subString(1,3)的时候,它指向像下面那样的一个完全新的字符串:
然而,这张图片并不是完全正确的,或者它只是代表了heap中真正发生了什么。在调用subString()时,JDK6和JDK7在堆里所发生的是不一样的。
3、JDK6中的subString()
字符串是有char数组实现的。在JDK6中,String类包含了3个field:char value[],int offset,int count。它们用来存储真正的字符数组,数组的第一个元素索引,字符串中字符个数。
当subString()方法被调用时,会创建一个新的字符串,但这个字符串的值仍然指向堆中同一个数组。不同的地方在于它们的offset和count。
下面的代码被简化了,仅用于说明该问题:
//JDK 6
String(int offset, int count, char value[]) {
this.value = value;
this.offset = offset;
this.count = count;
}
public String substring(int beginIndex, int endIndex) {
//check boundary
return new String(offset + beginIndex, endIndex - beginIndex, value);
}
4、JDK6中subString()方法带来的一个问题
如果你有一个很长的字符串,但是你每次仅仅是需要通过subString()得到其中很小的一部分。这就将会导致性能问题,因为你只是需要很小的一部分,但你却持有整个长字符串。(译者注:你一直保持着这个长字符串的引用,垃圾回收时候就不会对其回收,导致一直占用内存)对于JDK6,解决方法是用下面的代码,这样你就会使其指向一个真正的子串:
x = x.substring(x, y) + ""
5、JDK7中的subString()
上述问题,在JDK7中得到改进。在JDK7中,subString()方法会在堆中产生一个新的字符数组。
//JDK 7
public String(char value[], int offset, int count) {
//check boundary
this.value = Arrays.copyOfRange(value, offset, offset + count);
}
public String substring(int beginIndex, int endIndex) {
//check boundary
int subLen = endIndex - beginIndex;
return new String(value, beginIndex, subLen);
}