深入理解java中的String

最新推荐文章于 2024-03-16 14:03:27 发布

liu1002880404

最新推荐文章于 2024-03-16 14:03:27 发布

阅读量330

点赞数 2

分类专栏： java基础

本文链接：https://blog.csdn.net/liuerchong/article/details/107894371

版权

java基础专栏收录该内容

13 篇文章 5 订阅

订阅专栏

String 是如何实现的？它有哪些重要的方法？

以主流的 JDK 版本 1.8 来说，String 内部实际存储结构为 char 数组，源码如下：

public final class String implements java.io.Serializable,Comparable<String>,CharSequence{
    //用于存储字符串的值
    private final charvalue[];
    //缓存字符串的 hash code
    private int hash; //Default to 0
    //......其他内容
}

Stirng中的几个重要方法

1.多构造方法

String字符串中4个重要的构造方法:

// String 为参数的构造方法
public String(String original) {
        this.value = original.value;
        this.hash = original.hash;
    }
// char[] 为参数的构造方法
public String(char value[]) {
        this.value = Arrays.copyOf(value, value.length);
    }
// StringBuffer 为参数的构造方法
  public String(StringBuffer buffer) {
        synchronized(buffer) {
            this.value = Arrays.copyOf(buffer.getValue(), buffer.length());
        }
    }
// StringBuilder 为参数的构造方法
public String(StringBuilder builder) {
        this.value = Arrays.copyOf(builder.getValue(), builder.length());
    }

2.equals()比较两个字符串是否相等

源码如下：

public boolean equals(Object anObject) {
    // 对象引用相同直接返回true
    if (this == anObject) {
        return true;
    }
    // 判断需要对比的值是否为 String 类型，如果不是则直接返回 false
    if (anObject instanceof String) {
        String anotherString = (String)anObject;
        int n = value.length;
        if (n == anotherString.value.length) {
            // 把两个字符串转化为 char 数组对比
            char v1[] = value;
            char v2[] = anotherString.value;
            int i = 0;
            // 循环比对两个字符串的每一字符
            while (n-- != 0) {
                // 如果其中一个字符不相等就返回false 若相等就继续比对
                if (v1[i] != v2[i])
                    return false;
                i++;
            }
            return true;
        }
    }
    return false;
}

String类型重写了Object中的equals()方法，equals()方法需要传递一个Object类型的参数值，在比较时会先通过instanceof判断是否为String类型，如果不是则会直接返回false，instanceof的使用如下：

Object oString ="123";
Object oInt =123;
System.out.println(oString instanceof String);//返回 true 
System.out.println(oInt instanceof String);//返回false

当判断参数为String类型之后，会循环对比两个字符串中的每一个字符，当所有字符都相等时返回true，否则则返回false。还有一个和equals()比较类似的方法equalslgnoreCase()，它是用于忽略字符串的大小写之后进行字符串对比。

3.compareTo()比较两个字符串

compareTo() 方法用于比较两个字符串，返回的结果为 int 类型的值，源码如下：

public int compareTo(String anotherString) {
        int len1 = value.length;
        int len2 = anotherString.value.length;
        // 获取两个字符串长度最短的那个 int 值
        int lim = Math.min(len1, len2);
        char v1[] = value;
        char v2[] = anotherString.value;

        int k = 0;
        // 对比每个字符串
        while (k < lim) {
            char c1 = v1[k];
            char c2 = v2[k];
            if (c1 != c2) {
                // 有字符不相等就返回差值
                return c1 - c2;
            }
            k++;
        }
        return len1 - len2;
    }

从源码中可以看出，compareTo()方法会循环对比所有的字符，当两个字符串中有任意一个字符不相同时，则return char1-char2。比如，两个字符串分别存储的是1和2，返回的值是-1；如果存储的是1和1，则返回的值是0，如果存储的是2和1，则返回的值是1。还有一个和compareTo()比较类似的方法 compareTolgnoreCase()，用于忽略大小写后比较两个字符串。可以看出compareTo()方法和equals()方法都是用于比较两个字符串的，但它们有两点不同：

equals()可以接收一个Object 类型的参数，而compareTo()只能接收一个String类型的参数;
equals()返回值为Boolean，而compareTo()的返回值则为int。

它们都可以用于两个字符串的比较，当 equals()方法返回 true时，或者是compareTo()方法返回0 时，则表示两个字符串完全相同。

4.其他重要方法

indexOf():查询字符串首次出现的下标的位置
lastIndexOf():查询字符串最后出现的下表的位置
contains():查询字符串中是否含有另一个字符串
toLowerCase():把字符串全部转化为小写
toUpperCase():把字符串全部转化为大写
length():查询字符串的长度
trim():去除字符串首尾的空格
replace():替换字符串中的某些字符
split():把字符串分割并返回字符串数组
jion():把字符串数组转化为字符串

这道题目考察的重点是，你对 Java 源码的理解，这也从侧面反应了你是否热爱和喜欢专研程序，而这正是一个优秀程序员所必备的特质。

String 源码属于所有源码中最基础、最简单的一个，对 String 源码的理解也反应了你的 Java 基础功底。

String 问题如果再延伸一下，会问到一些更多的知识细节，这也是大厂一贯使用的面试策略，从一个知识点入手然后扩充更多的知识细节，对于 String 也不例外，通常还会关联的询问以下问题：

为什么 String 类型要用 final 修饰？
== 和 equals 的区别是什么？
String 和 StringBuilder、StringBuffer 有什么区别？
String 的 intern() 方法有什么含义？
String 类型在 JVM（Java 虚拟机）中是如何存储的？编译器对 String 做了哪些优化？

String的扩展问题

1.==和equals的区别

==对于基本数据类型来说，是用于比较“值"是否相等的；而对于引用类型来说，是用于比较引用地址是否相同的。查看源码我们可以知道Object中也有equals()方法，源码如下：

public boolean equals(Object obj) {
    return (this == obj);
}

可以看出，Object 中的 equals() 方法其实就是 ==，而 String 重写了 equals() 方法把它修改成比较两个字符串的值是否相等。源码如下：

public boolean equals(Object anObject) {
    // 对象引用相同直接返回true
    if (this == anObject) {
        return true;
    }
    // 判断需要对比的值是否为 String 类型，如果不是则直接返回 false
    if (anObject instanceof String) {
        String anotherString = (String)anObject;
        int n = value.length;
        if (n == anotherString.value.length) {
            // 把两个字符串转化为 char 数组对比
            char v1[] = value;
            char v2[] = anotherString.value;
            int i = 0;
            // 循环比对两个字符串的每一字符
            while (n-- != 0) {
                // 如果其中一个字符不相等就返回false 若相等就继续比对
                if (v1[i] != v2[i])
                    return false;
                i++;
            }
            return true;
        }
    }
    return false;
}

2.final修饰的好处

从 String 类的源码我们可以看出 String 是被 final 修饰的不可继承类，源码如下：

public final class String implements java.io.Serializable,Comparable<String>,CharSequence{
    ...
}

那这样设计有什么好处呢？

Java 语言之父James Gosling的回答是，他会更倾向于使用final，因为它能够缓存结果，当你在传参时不需要考虑谁会修

改它的值；如果是可变类的话，则有可能需要重新拷贝出来一个新值进行传参，这样在性能上就会有一定的损失。

James Gosling 还说迫使String类设计成不可变的另一个原因是安全，当你在调用其他方法时，比如调用一些系统级操作

指令之前，可能会有一系列校验，如果是可变类的话，可能在你校验过后，它的内部的值又被改变了，这样有可能会引起

严重的系统崩溃问题，这是迫使String类设计成不可变类的一个重要原因。

总结来说，使用final修饰的第一个好处是安全；第二个好处是高效，以JVM中的字符串常量池来举例，如下两个变量：

String s1 = "java";
String s2 = "java";

只有字符串是不可变时，我们才能实现字符串常量池，字符串常量池可以为我们缓存字符串，提高程序的运行效率，

试想一下如果String是可变的，那当 s1 的值修改之后，s2 的值也跟着改变了，这样就和我们预期的结果不相符了，因此也就没有办法实现字符串常量池的功能了。

这里引申出几个问题

一、String为什么不可变？
要了解String类创建的实例为什么不可变，首先要知道final关键字的作用：final的意思是“最终，最后”。final关键字可以修饰类、方法、字段。修饰类时，这个类不可以被继承；修饰方法时，这个方法就不可以被覆盖(重写)，在JVM中也就只有一个版本的方法--实方法；修饰字段时，这个字段就是一个常量。

String类被关键字final修饰，可以说明它不可被继承；从"private final char value[]"可知，String本质上是一个char数组。

二， String类的成员字段value是一个char[]数组，而且也是用final关键字修饰，被final关键字修饰的字段在创建后其值是不可变的，但也只是value这个引用地址不可变，可是Array数组的值却是可变的。value是被final关键字修饰的，编译器不允许把value指向堆另外一个地址；但如果直接对数组元素进行赋值，就允许；String是不可变，在后面所有的String方法里没有去动Array中的元素，也没有暴露内部成员字段。private final char value[],private的私有访问权限的作用都比final大。所以String是不可变的关键都是在底层实现的，而不是一个简单的final关键字。
有一个字符串s的值为"abcd"，它再次被赋值为"abcdef"，不是在原堆的地址上修改数据，而是重新指向一个新的对象，新的地址。

三，字符串常量池
字符串常量池是方法区(Method Area)中一个特殊的存储区域。当一个字符串被创建时，如果这个字符串的值已经存在String pool中，就返回这个已经存在的字符串引用，而不是创建一个新的对象。下面的代码只会在堆中创建一个对象：

String name="abcd";
String userName="abcd";

这样在大量使用字符串的情况下，可以节省内存空间，提高效率。但之所以能实现这个特性，String的不可变性是最基础的一个必要条件。

四、String类不可变有什么好处？
最简单的就是为了安全和效率。从安全上讲，因为不可变的对象不能被改变，他们可以在多个线程之间进行自由共享，这消除了进行同步的要求；从效率上讲，设计成final，JVM才不用对相关方法在虚函数表中查询，而是直接定位到String类的相关方法上，提高执行效率；总之，由于效率和安全问题，String被设计成不可变的，这也是一般情况下，不可变的类是首选的原因。

五、不可变类
不可变类只是它的实例不能被修改的类。每个实例中包含的所有信息都必须在创建该实例时就提供，并在对象的整个生命周期内固定不变。String、基本类型的包装类、BigInteger和BigDecimal就是不可变得类。

为了使类成为不可变，必须遵循以下5条规则：①不要提供任何会修改对象状态的方法。②保证类不会被扩展。③使所有的域都是final。④使所有的域都成为私有的。⑤确保对于任何可变组件的互斥访问。如果类具有指向可变对象的域，则必须确保该类的客户端无法获得指向这些对象的引用。

六、不可变类的优点和缺点
不可变类实例不可变性，具有很多优点。①不可变类对象比较简单。不可变对象可以只有一种状态，即被创建时的状态。②不可变对象本质上是线程安全的，它们不要求同步。当多个线程并发访问这样的对象时，它们不会遭到破坏。实际上，没有任何线程会注意到其他线程对于不可变对象的影响。所以，不可变对象可以被自由地分配。“不可变对象可以被自由地分配”导致的结果是：永远不需要进行保护性拷贝。③不仅可以共享不可变对象，甚至也可以共享它们的内部信息。④不可变对象为其他对象提供了大量的构件。如果知道一个复杂对象内部的组件不会改变，要维护它的不变性约束是比较容易的。

不可变类真正唯一的缺点是，对于每个不同的值都需要一个单独的对象。创建这种对象的代价很高。

七、如何构建不可变类？
构建不可变类有两种方式：用关键字final修饰类和让类的所有构造器都变成私有的或者包级私有的，并添加公有的静态工厂来替代公有的构造器。

为了具体说明用静态工厂方法来替代公有的构造器，下面以Complex为例：

//复数类
public class Complex{
//实数部分
private final double re;
//虚数部分
private final double im;
//私有构造器
private Complex(double re,double im){
this.re = re;
this.im = im;
}
//静态工厂方法，返回对象唯一实例
public static Complex valueOf(double re,double im){
return new Complex(re,im);
}
...
}
不可变的类提供一些静态工厂方法，它们把频繁请求的实例缓存起来，从而当现在实例符合请求的时候，就不必创建新的实例。使用这样的静态工厂方法使得客户端之间可以共享现有的实例，而不是创建新的实例，从而减低内存占用和垃圾回收的成本。

总之，使类的可变性最小化。不要为每个get方法编写一个相对应的set方法，除非有很好的理由要让类成为可变的类，否则就应该是不可变的。如果有些类不能被做成是不可变的，仍然应该尽可能地限制它的可变性。不可变的类有很多优点，但唯一的缺点就是在特定的情况下存在潜在的性能问题。

3. String 和 StringBuilder、StringBuffer 的区别

因为String类型是不可变的，所以在字符串拼接的时候如果使用String的话性能会很低，因此我们就需要使用另一个数据类型StringBuffer，它提供了append和insert方法可用于字符串的拼接，它使用synchronized来保证线程安全，如下源码所示：

    @Override
    public synchronized StringBuffer append(Object obj) {
        toStringCache = null;
        super.append(String.valueOf(obj));
        return this;
    }

    @Override
    public synchronized StringBuffer append(String str) {
        toStringCache = null;
        super.append(str);
        return this;
    }

因为它使用了synchronized来保证线程安全，所以性能不是很高，于是在JDK1.5就有了StringBuilder，它同样提供了append和insert的拼接方法，但它没有使用synchronized来修饰，因此在性能上要优于StringBuffer，所以在非并发操作的环境下可使用StringBuilder来进行字符串拼接。

4.String和JVM

String常见的创建方式有两种，直接赋值的方式"String s1="Java";"和"String s2=new String("Java");"的方式，但两者在JVM的存储区域却截然不同，在JDK1.8中，变量s1会先去字符串常量池中找字符串"Java”，如果有相同的字符则直接返回常量句柄，如果没有此字符串则会先在常量池中创建此字符串，然后再返回常量句柄；而变量s2是直接在堆上创建一个变量，如果调用intern方法才会把此字符串保存到常量池中，如下代码所示：

String s1 = new String("Java");
String s2 = s1.intern();
String s3 = "Java";
System.out.println(s1 == s2); // false
System.out.println(s2 == s3); // true

它们在 JVM 存储的位置，如下图所示：

小贴士：JDK 1.7 之后把永生代换成的元空间，把字符串常量池从方法区移到了 Java 堆上。

除此之外编译器还会对 String 字符串做一些优化，例如以下代码：
String s1 = "Ja" + "va";
String s2 = "Java";
System.out.println(s1 == s2);
虽然 s1 拼接了多个字符串，但对比的结果却是 true，我们使用反编译工具，看到的结果如下：
 0 ldc #2 <Java>
 2 astore_1
 3 ldc #2 <Java>
 5 astore_2
 6 getstatic #3 <java/lang/System.out>
 9 aload_1
10 aload_2
11 if_acmpne 18 (+7)
14 iconst_1
15 goto 19 (+4)
18 iconst_0
19 invokevirtual #4 <java/io/PrintStream.println>
22 return
从编译代码 #2 可以看出，代码 "Ja"+"va" 被直接编译成了 "Java" ，因此 s1==s2 的结果才是 true，这就是编译器对字符串优化的结果。

小结

本课时从 String 的源码入手，重点讲了 String 的构造方法、equals() 方法和 compareTo() 方法，其中 equals() 重写了 Object 的 equals() 方法，把引用对比改成了字符串值对比，也介绍了 final 修饰 String 的好处，可以提高效率和增强安全性，同时我们还介绍了 String 和 JVM 的一些执行细节。