Java源码研究 - String篇

按住ctrl,访问String类的实现代码。

可以看到String这个类用final关键词修饰,是无法被继承的。String这个类实现了java.io.SerializableComparableCharSequence接口, 其中Serializable用于标记String是可被序列化的,实现Comparable接口则是为了实现这个接口中的compareTo()方法,让自己可与其他字符串进行比较。


String中实现的compareTo()方法的原理:

按照字母顺序比较两个字符串,比较字符串中每个字符的Unicode对应值。

Q:这里发现一个比较有趣的点,value是String的私有属性,但是在compareTo方法中,却有anotherString.value.length这样的代码,为什么能访问到anotherString的value属性呢?

通过阅读compareTo()的源码,就能理解这个方法的工作方式。


String类的构造方法

String类有十几个构造方法。这么多构造方法,可能会觉得没必要全部研究下来,不过仔细想想,如果一个构造方法用不到的话,Java源码开发者当初还去写这些构造方法干嘛?之所以写下来,肯定是在某些情况下会用到。

这些构造方法我们一个个研究下来。

1

看一下下面这个String的构造方法:

public String() {
    this.value = "".value;
}

当调用String的无参构造时,会给String的value属性赋值"".value,也就是说""有value属性。那么问题就来了,Java是怎么知道""是String类型的?

2

public String(String original) {
    this.value = original.value;
    this.hash = original.hash;
}

这个构造方法接收一个字符串作为输入,直接将字符串的引用和hash值赋给所创建的String对象。

3

public String(char value[]) {
    this.value = Arrays.copyOf(value, value.length);
}

该构造方法接收一个字符数组作为输入,内部使用Arrays数组工具类的copyOf()方法来将字符数组转化为字符串 将字符数组复制一份,赋给value。至于copyOf()的底层源码我还没研究,目前是个谜。

4

public String(char value[], int offset, int count) {
    if (offset < 0) {
        throw new StringIndexOutOfBoundsException(offset);
    }
    if (count <= 0) {
        if (count < 0) {
            throw new StringIndexOutOfBoundsException(count);
        }
        if (offset <= value.length) {
            this.value = "".value;
            return;
        }
    }
    // Note: offset or count might be near -1>>>1.
    if (offset > value.length - count) {
        throw new StringIndexOutOfBoundsException(offset + count);
    }
    this.value = Arrays.copyOfRange(value, offset, offset+count);
}

这个构造方法没前几个那么好理解,其中存在比较多的逻辑判断。不过梳理一下该方法理解起来还是挺容易的,其判断逻辑大致如下:

在这里插入图片描述

offset > value.length - count 这个逻辑判断可能不太好理解,只要将其变成 offset + count > value.length 的形式理解起来就很直观了。

5

public String(int[] codePoints, int offset, int count) {
    if (offset < 0) {
        throw new StringIndexOutOfBoundsException(offset);
    }
    if (count <= 0) {
        if (count < 0) {
            throw new StringIndexOutOfBoundsException(count);
        }
        if (offset <= codePoints.length) {
            this.value = "".value;
            return;
        }
    }
    // Note: offset or count might be near -1>>>1.
    if (offset > codePoints.length - count) {
        throw new StringIndexOutOfBoundsException(offset + count);
    }

    final int end = offset + count;

    // Pass 1: Compute precise size of char[]
    int n = count;
    for (int i = offset; i < end; i++) {
        int c = codePoints[i];
        if (Character.isBmpCodePoint(c))
            continue;
        else if (Character.isValidCodePoint(c))
            n++;
        else throw new IllegalArgumentException(Integer.toString(c));
    }

    // Pass 2: Allocate and fill in char[]
    final char[] v = new char[n];

    for (int i = offset, j = 0; i < end; i++, j++) {
        int c = codePoints[i];
        if (Character.isBmpCodePoint(c))
            v[j] = (char)c;
        else
            Character.toSurrogates(c, v, j++);
    }

    this.value = v;
}

在String类的源码中,会频繁出现@NotNull这个注解。


String的常用方法

length()

获取字符串长度。在底层这个方法的实现实在简单,就是返回String类所封装的字符数组value的长度。

isEmpty()

判断字符串是否为空字符串。底层就这一句代码,判断字符数组的长度是否为0:return value.length == 0;

charAt()

获取指定索引的字符。底层的关键代码就这一句,返回字符数组指定索引的字符:return value[index];

到这里,可以发现,其实Java的String类在本质上是个字符数组。

concat()

拼接字符串。这个方法需要花点时间来研究。其底层实现代码的注释如下,大家应该能看懂:

public String concat(String str) {

	// 判断str是否为空,若空,返回原来的字符串
    if (str.isEmpty()) {
        return this;
    }
    
    int len = value.length; // 原字符串长度
    int otherLen = str.length(); // 目标字符串长度
    char buf[] = Arrays.copyOf(value, len + otherLen); // 创建一个长度为len + otherLen的字符数组,数组最前面的元素为原字符串中的字符,数组剩余的元素均为空格
    str.getChars(buf, len); // 将目标字符串中的字符放到buf的剩余位置上
    return new String(buf, true); // 返回拼接后的字符串
    
}

该方法return的构造方法底层实现其实跟String(char value[])这个构造方法一样,share这个参数没什么用:

String(char[] value, boolean share) {
    // assert share : "unshared not supported";
    this.value = value;
}

contains()

contains()接收一个CharSequence接口类型的变量。

String类实现了CharSequence接口。

substring()

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值