JDK6和JDK7中的substring(int beginIndex, int endIndex)方法是不同的。了解它们之间的区对我们是很有帮助的。为了简单起见,下文用substring()表示substring(int beginIndex, int endIndex)方法。
1. substring()方法的作用
substring(int beginIndex, int endIndex)方法返回一个在原字符串从beginIndex位置开始到endIndex-1位置的子串。
String x = "abcdef";
x = x.substring(1,3);
System.out.println(x);
输出结果为:
bc
2. 调用substring()方法时都发生了哪些事儿?
你应该知道,x是不可变的。将x.substring(1, 3)方法的返回结果赋给x后,x指向一个全新的字符串,如下图所示:
然而,上图并不完全正确,它只是展示了堆(heap)中发生的事。实际上,在JDK6和JDK7中调用substring()时,发生的事情是不一样的。
3. JDK6中的substring()
字符串(String)是基于字符数组(char array)实现的。在JDK6中,字符串类包含3哥字段:char value[],int offset,int count。它们分别被用来存放一个字符数组、数组中第一个索引位置、字符串中字符的个数。
调用substring()方法时,将会创建一个新的字符串,而字符串的值依然指向堆中的同一个数组。两个字符串对象的区别在于它们的count和offset字段。
下面这段代码简单地解释了该问题中的要点:
//JDK 6
String(int offset, int count, char value[]) {
this.value = value;
this.offset = offset;
this.count = count;
}
public String substring(int beginIndex, int endIndex) {
//check boundary
return new String(offset + beginIndex, endIndex - beginIndex, value);
}
4. JDK6中的substring()方法引起的问题
如果你有一个很长很长的字符串,而你只需要用substring()方法取其中很小的一部分。你只需要一小部分,但你却要保留完整的一个长串,这会带来性能上的一些问题。在JDK6中,可以使用下面的方法来让字符串引用指向一个真正的子串(sub string):
x = x.substring(x, y) + ""
5. JDK7中的substring()方法
JDK7对substring()方法作了改进,在使用该方法时会在堆中创建一个全新的数组。
//JDK 7
public String(char value[], int offset, int count) {
//check boundary
this.value = Arrays.copyOfRange(value, offset, offset + count);
}
public String substring(int beginIndex, int endIndex) {
//check boundary
int subLen = endIndex - beginIndex;
return new String(value, beginIndex, subLen);
}