按住ctrl,访问String类的实现代码。
可以看到String这个类用final关键词修饰,是无法被继承的。String这个类实现了java.io.Serializable
、Comparable
和CharSequence
接口, 其中Serializable用于标记String是可被序列化的,实现Comparable接口则是为了实现这个接口中的compareTo()方法,让自己可与其他字符串进行比较。
String中实现的compareTo()方法的原理:
按照字母顺序比较两个字符串,比较字符串中每个字符的Unicode对应值。
Q:这里发现一个比较有趣的点,value是String的私有属性,但是在compareTo方法中,却有
anotherString.value.length
这样的代码,为什么能访问到anotherString的value属性呢?
通过阅读compareTo()的源码,就能理解这个方法的工作方式。
String类的构造方法
String类有十几个构造方法。这么多构造方法,可能会觉得没必要全部研究下来,不过仔细想想,如果一个构造方法用不到的话,Java源码开发者当初还去写这些构造方法干嘛?之所以写下来,肯定是在某些情况下会用到。
这些构造方法我们一个个研究下来。
1
看一下下面这个String的构造方法:
public String() {
this.value = "".value;
}
当调用String的无参构造时,会给String的value属性赋值"".value
,也就是说""
有value属性。那么问题就来了,Java是怎么知道""
是String类型的?
2
public String(String original) {
this.value = original.value;
this.hash = original.hash;
}
这个构造方法接收一个字符串作为输入,直接将字符串的引用和hash值赋给所创建的String对象。
3
public String(char value[]) {
this.value = Arrays.copyOf(value, value.length);
}
该构造方法接收一个字符数组作为输入,内部使用Arrays数组工具类的copyOf()方法来将字符数组转化为字符串 将字符数组复制一份,赋给value。至于copyOf()的底层源码我还没研究,目前是个谜。
4
public String(char value[], int offset, int count) {
if (offset < 0) {
throw new StringIndexOutOfBoundsException(offset);
}
if (count <= 0) {
if (count < 0) {
throw new StringIndexOutOfBoundsException(count);
}
if (offset <= value.length) {
this.value = "".value;
return;
}
}
// Note: offset or count might be near -1>>>1.
if (offset > value.length - count) {
throw new StringIndexOutOfBoundsException(offset + count);
}
this.value = Arrays.copyOfRange(value, offset, offset+count);
}
这个构造方法没前几个那么好理解,其中存在比较多的逻辑判断。不过梳理一下该方法理解起来还是挺容易的,其判断逻辑大致如下:
offset > value.length - count
这个逻辑判断可能不太好理解,只要将其变成offset + count > value.length
的形式理解起来就很直观了。
5
public String(int[] codePoints, int offset, int count) {
if (offset < 0) {
throw new StringIndexOutOfBoundsException(offset);
}
if (count <= 0) {
if (count < 0) {
throw new StringIndexOutOfBoundsException(count);
}
if (offset <= codePoints.length) {
this.value = "".value;
return;
}
}
// Note: offset or count might be near -1>>>1.
if (offset > codePoints.length - count) {
throw new StringIndexOutOfBoundsException(offset + count);
}
final int end = offset + count;
// Pass 1: Compute precise size of char[]
int n = count;
for (int i = offset; i < end; i++) {
int c = codePoints[i];
if (Character.isBmpCodePoint(c))
continue;
else if (Character.isValidCodePoint(c))
n++;
else throw new IllegalArgumentException(Integer.toString(c));
}
// Pass 2: Allocate and fill in char[]
final char[] v = new char[n];
for (int i = offset, j = 0; i < end; i++, j++) {
int c = codePoints[i];
if (Character.isBmpCodePoint(c))
v[j] = (char)c;
else
Character.toSurrogates(c, v, j++);
}
this.value = v;
}
在String类的源码中,会频繁出现@NotNull
这个注解。
String的常用方法
length()
获取字符串长度。在底层这个方法的实现实在简单,就是返回String类所封装的字符数组value的长度。
isEmpty()
判断字符串是否为空字符串。底层就这一句代码,判断字符数组的长度是否为0:return value.length == 0;
。
charAt()
获取指定索引的字符。底层的关键代码就这一句,返回字符数组指定索引的字符:return value[index];
到这里,可以发现,其实Java的String类在本质上是个字符数组。
concat()
拼接字符串。这个方法需要花点时间来研究。其底层实现代码的注释如下,大家应该能看懂:
public String concat(String str) {
// 判断str是否为空,若空,返回原来的字符串
if (str.isEmpty()) {
return this;
}
int len = value.length; // 原字符串长度
int otherLen = str.length(); // 目标字符串长度
char buf[] = Arrays.copyOf(value, len + otherLen); // 创建一个长度为len + otherLen的字符数组,数组最前面的元素为原字符串中的字符,数组剩余的元素均为空格
str.getChars(buf, len); // 将目标字符串中的字符放到buf的剩余位置上
return new String(buf, true); // 返回拼接后的字符串
}
该方法return的构造方法底层实现其实跟String(char value[])
这个构造方法一样,share这个参数没什么用:
String(char[] value, boolean share) {
// assert share : "unshared not supported";
this.value = value;
}
contains()
contains()接收一个CharSequence接口类型的变量。
String类实现了CharSequence接口。